AI 산업의 미래에 대한 아무런 생각들
≡ 목차 (Table of Contents)
이 글은 더이상 업데이트 되지 않으며 대신 ⏍https://seorenn.github.io/article/future-of-ai-industry.html 글에서 새로 정리 중입니다.
AI에 대한 관심과 투자가 한참인 지금, 과연 AI 산업의 미래는 밝기만 할까? 투자자 입장에서 그리고 엔지니어 입장에서 규제와 산업에 가해질 압력과 그 미래에 대해 상상해보자. 일부 근거는 사설 등을 기반으로 하지만 일부는 뇌피셜 이라는 점을 참고하자.
독점
초창기이니 독점 이슈를 걱정할 필요는 없겠지만 한번 생각해보자.
현재는 AI를 위해선 Nvidia의 GPU나 칩이 필요해 사실상 독점 상태다. A100을 넘어 차세대 AI 칩인 H100도 이미 주문 폭증이라고 한다. 하드웨어만이 아니더라도 CUDA 등의 기술적 독점도 포함된다.
당연하겠지만 독점 기업엔 규제가 뒤따를 수밖에 없다. 중국처럼 국가가 밀어주는 경우가 아니라면 말이다. 그렇다면 어떤 식으로 규제가 들어갈까? 하드웨어 독점에 관한 규제는 본 적이 없어서 잘 모르겠지만 뭔가 칩 설계에서 공개해야 하는 정보가 강제되지 않을까?
물론 이 상황은 AMD, Google, Apple 등 후속 주자의 활약에 따라 다를 수 있다. 아 잠깐 Apple은 후속 주자가 아닐까? 아예 주자가 아닌 걸까?
독점 2
독점은 여러 분야에서 살펴볼 수 있다. 예를 들어 시스템 반도체 제조 공정을 갖추고 있는 곳은 어디일까? TSMC? 삼성? 유명한 파운더리는 이 둘이 있지만 AI칩에 한해서는 아직은 TSMC 독점인 것 같다. 물론 애플이 대부분의 물량을 장악하고 있어서 Nvidia의 물량은 정말 빌어서 얻는 그런 느낌이겠지만 말이다.
이 상황에서 좋은 결론은 삼성전자가 수혜를 입는 것 같다. 삼성전자가 Nvidia의 일부 칩을 만들 수도 있겠지만 경쟁업체 특히 AMD의 칩 생산을 계약할 수 있다면 아마도 파운더리 독점 독점 이슈는 아마도 존재하진 않을 것 같다.
물론 삼성전자가 얼마나 공정 수율을 잘 뽑아내느냐가 가장 우선인 이야기다.
그런데 파운더리 독점이 과연 이슈가 될 수 있을까? 지금은 아닌 것 같다. 하지만 미래는 알 수 없으니 말이다.
독점 3
과연 소프트웨어 기술도 독점이 될까? CUDA 같은 플랫폼에 가까운 것 말고 다수 학습에 이용되는 소프트웨어들을 볼 때 일단 독점 이슈와는 거리가 있어보인다. 대부분은 오픈소스이기 때문에 누구나 쓸 수 있기 때문이다. 물론 라이센스라는게 있긴 하지만 특별히 소스코드 원본을 건드리지 않는다면 대체로 상업적 이용에 아무런 문제가 없다.
하지만 거의 독점적 기술에 가까운 오픈소스가 특정 기업 하나에 강하게 휘둘린다면 그건 독점일까 아닐까?
전성비
암호화폐 채굴과 연관지어서 생각해보자. AI는 학습에 막대한 비용이 드는데 여기에는 대규모 설비 구동을 위한 전기가 필수다. 사실상 채굴과 동일하다. 채굴을 위해 GPU를 굴리는 것과 학습을 위해 GPU를 굴리는 것은 물리적으로 동일한 행위다. 즉 전기가 매우 많이 소모되는 행위다. 단지 결과물의 용도가 다를 뿐이다.
그렇다면 이런 상황을 기후위기에 관심이 많은 유럽 등에서 과연 그대로 넘어갈까? 신재생에너지 의무비율이나 RE100 준수 등 많은 요구가 있을 것 같다고 생각되지만 그보다 더한 규제가 있지는 않을까?
이 문제는 '순수 AI' 기술의 발전을 방해하는 개인적으로 꼽는 큰 장애물이 될 거라고 생각한다.
물론 이로 인해 높은 전성비의 AI 칩 개발이라는 다른 종류의 발전으로 이어질 가능성도 있다.
그 다음 경쟁은 소프트웨어
현재는 AI 모델 학습을 위해 Python 같은 컴퓨팅 효율이 낮은 대신 사람과의 소통이 편한 언어를 종종 사용한다. 빠르게 개발해서 빨리 성과를 보자는 주의도 있는 것 같다. 이는 강력한 하드웨어가 있기에 가능한 일이었다.
하지만 전성비를 중요시 해야 할 상황이 온다면? 하드웨어의 비중을 줄이게 될 단계가 된다. 이건 경우라면 소프트웨어의 효율성 개선도 중요해 질 것 같다.
지금도 있긴 하지만 또다른 AI 전용 언어 등의 출현도 충분히 가능하다. 병렬 컴퓨팅이나 AI 데이터 구조 표현 등에 적합한 언어 모델로 말이다. 물론 지금도 있긴 있다. 하지만 경쟁은 발전을 위한 가장 중요한 요소이니 더 발전된 언어가 나올 수도 있다.
또다른 규제와 함께 또다른 발전의 가능성이 보여서 참 재미있는 것 같다.
어쨌거나 이런 분야에는 독점 걱정이 그나마 덜한 편이다. 대체로 오픈소스로 개발될 확률이 높으니 말이다.
저작권
개인적으로 AI 발전에 가장 큰 걸림돌로 꼽는 게 바로 이 저작권이다.
AI는 학습이 핵심인데 이 학습 자료의 저작권에 대한 방침은 아직은 특별할 게 없다. 학습을 위한 라이센스 개념도 아직은 없는 것 같다. 물론 학습 뿐만 아니라 추론 자료의 최종 저작권도 중요한 이슈기도 하다.
이와 관련해서 이미 유럽에선 규제가 도입되기 시작했다. 다만 우선은 학습 자료의 저작권을 공개하는 방식으로 시작되는 모양이다.
학습 자료의 저작권 공개가 말은 쉽지만 상당한 난이도의 일이 될 수도 있다. 학습 데이터는 천문학적이라 표현할 수 있을 정도로 많은 내용을 다룰 텐데 이들 전부 저작권을 공개해야 한다면 어떻게 될까? 이런데 인력과 비용을 투자하기 힘든 작은 기업에선 사실상 불가능에 가깝다.
이후 있어야 할 일은 아마도 AI 학습 및 추론에 적용될 표준 라이센스 도입이지 않을까 생각되기도 한다. 그리고 그 내용에 따라 상업용 AI 발전의 속도가 달리질 수도 있다고 보인다.
개인적으로는 저작권은 반드시 지켜져야 되고 보호되어야 한다는 입장이다. 그래서 이런 규제는 환영하고 오히려 아직 너무 약한 규제라고 생각할 뿐이다. 아마도 제대로 된 규제가 등장하기 전까진 AI 저작권 침해 소송은 이어질 것 같다.
프라이버시
프라이버시 즉 개인의 인적 정보나 사생활 정보는 어떻게 규제될 것인가도 중요한 이슈가 될 것 같다. 이는 특히 법적 규제 가능성이 가장 높은 부문이기도 하다.
아무래도 프라이버시는 학습 난이도를 급증시키는 문제를 동반하게 될 것 같다. 어차피 학습 단계에서 프라이버시를 잘 걸러낸다면 추론 과정에선 문제될 것은 없을 것이다. 하지만 위의 학습 자료 저작권 공개와 함께 이 문제도 결국 작은 기업에선 불가능에 가까운 일이 될 것 같다.
역시나 상업용 AI 발전에는 큰 걸림돌이 될 것 같다.
프라이버시 2
지금까지의 대부분의 AI는 초대형 컴퓨팅 시스템이 있어야만 가능하다. 학습과정에서도 그렇고 학습된 내용을 저장하는 데도 그렇고 추론하는 데도 그렇고 일반인에겐 소유가 무리인 수준의 대규모 인프라가 필요하다. 이런 기존 AI 시스템을 비교를 위한 이름으로 '클라우드 AI'라고 대충 칭해보자.
앞서 지적된 프라이버시 문제는 애초에 이런 클라우드 AI에 데이터를 맡겨야 되기 때문에 발생한다고 볼 수 있다. 그렇다면 반대로 클라우드에 내 정보를 맡기지 않아도 된다면 어떻게 될까? 이른바 '개인용 AI' 말이다. 일반적으로 엣지AI(Edge AI 혹은 On Device AI 등의 로컬 AI 엔진)라 불리는 방식 말이다.
이미 애플은 이 엣지AI를 밀고 있다. AI의 판단이 필요한 부분을 대부분 어딘가로 전송하지 않고 개인용 하드웨어 내에서 처리한다. 프라이버시 하나는 거의 완벽하게 보호해 줄 수 있는 방법이다.
물론 큰 단점이 하나 있다. 이런 엣지AI는 대규모 학습 자체가 불가능하다. 학습 자체는 클라우드 AI를 동원해야 하고 이렇게 학습된 최종 데이터를 전달해서 사용하는 형태로 당장은 좀 불완전할 수밖에 없다.
결국은 대기업에 유리한 구조
앞서 많은 항목을 적어놨는데 이를 뭉뚱그리면 결국 대기업에 유리한 환경이라는 점이 나온다.
그나마 현재는 기술 초기라 기술 기업에 유리할 수도 있는 환경이다. 하지만 기술 기반이 어느 정도 완성되고 이후 발전이 더뎌질 즈음엔 막대한 인프라를 앞세운 대기업이나 빅테크의 전유물이 될 가능성이 크다. 특히나 비용 면에선 소기업이 엄청난 운영비를 감당할 투자를 받기는 쉽지 않은 일일 것이다.
안 그래도 기술 개발을 하는 소기업이나 스타트업에서 이후 만들어질 규제를 지키기도 매우 힘든 환경이 될 거다.
비리
AI가 발전함에 따라 예상할 수 있는 것은 AI를 이용한 비리나 범죄 가능성을 생각해 볼 수 있다. 예를 들어 특정 시장 시세와 관련된 AI가 알려주는 정보가 편향되거나 누군가에게 이득이 되도록 조정되어 있다면 어떤 결과가 발생할까?
결국 AI의 중립성을 더더욱 강화시키는 규제로 이어질 가능성도 제법 높은 것 같다.
현실은 어떨까?
슬슬 AI와 관련된 여러 판단과 규제가 정리되고 있는 것 같다. 관련된 링크를 정리해 보자.
- ⏍"수십억 달러 벌금 낼 수도"…세계 첫 AI 규제법, 유럽 초안 통과
- ⏍AI규율 국제적 논의 본격화…개인정보위, 주요 정책방향 제시
- ⏍‘AI’와 관련된 잘못된 생각
- ⏍윈도우 코파일럿··· 아직은 혼란한 AI 비서
- ⏍AI 규제에 동조하는 마이크로소프트의 속내
- ⏍미 코미디언 사라 실버맨, 오픈AI와 메타에 저작권 침해 소송 제기
- ⏍바 연준 금융당국 부의장 "AI, 불법 대출 관행 부추길 위험"
- ⏍높아지는 AI 규제 요청의 목소리··· “규제 없으면 솔루션 업체 아닌 기업이 책임질지도”
- ⏍영국, AI를 장기적 보안 위협으로 공식화
- ⏍허용과 권장? 금지와 모니터링?··· 4인의 CIO가 말하는 '셰도우 AI와 씨름하기'
- ⏍온신협, “AI의 뉴스 무단 사용은 저작권 침해”
- ⏍George R.R. Martin, John Grisham and other writers sue over ChatGPT
- ⏍어설픈 기사로 조롱거리 된 AI 기자 外··· 'AI 재난' 9선
- ⏍생성형 AI로 매출 증대?
- ⏍내 저작물을 지켜라··· 생성형 AI에 '독 푸는' 도구의 등장
- ⏍EU 이어 미국도 AI 규제 본격화··· 바이든 ‘AI 행정 명령’에 대한 업계 평가는?
- ⏍오픈AI(OpenAI)와 마이크로소프트(MSFT) 상대로 저작권 침해 집단 소송
- ⏍오픈AI의 논리는 결국 ‘복사, 절도, 붙여넣기’
- ⏍주요 4개 AI 모델 중 GPT-4, 저작권 침해 최악
- ⏍엔비디아도 저작권 소송… 작가들 “AI 모델 학습에 무단 이용”
- ⏍유럽의회, 세계 첫 AI 규제법 승인··· 기업에 미치는 영향은?