2026년 4월, AI 업계가 또 한 번 뜨거워졌습니다. 구글 딥마인드의 CEO 데미스 하사비스가 "AI 스케일링 법칙은 아직 한계에 부딪히지 않았다"고 단언하며 LLM 상품화 우려를 정면으로 반박한 것인데요. 같은 시기 엔비디아는 메모리 효율을 10배 이상 끌어올리는 기술을 발표했고, 정체불명의 AI 모델이 영상 생성 벤치마크 1위를 찍는 이변도 벌어졌습니다. 요즘 AI 뉴스는 정말 숨 돌릴 틈이 없네요. 오늘은 이 흐름을 하나씩 짚어보겠습니다.
2026년 4월 7일, 데미스 하사비스는 인터뷰에서 AI 스케일링 법칙이 한계에 도달했다는 시장의 우려를 정면으로 일축했습니다. 더 많은 데이터, 더 많은 연산, 더 큰 모델을 쌓는 방식이 여전히 유효하다는 것이 그의 핵심 주장입니다. 심지어 스케일링을 "최대한 밀어붙여야 한다(pushed to the maximum)"고까지 표현했습니다.
그는 AGI 실현 시점에 대해서도 구체적인 시각을 내놨습니다. "앞으로 5년 이내, 즉 2031년 전후에 AGI가 현실화될 수 있다"고 언급하면서, 현재 AI 모델들은 이미 매주 단위로 급격히 발전하고 있다고 강조했습니다. 그러면서도 추론 능력과 장기 계획 수립, 시스템 견고성 같은 영역에서 한두 가지 추가적인 기술 돌파구가 필요하다는 점은 솔직히 인정했습니다.
"결국 하사비스는 이 기술적 특이점이 질병 정복부터 인간 의식을 은하계로 확장하는 수준까지 인류의 번영을 극대화할 것이라고 말합니다. 산업혁명을 훌쩍 넘어설 영향력이라는 표현까지 썼는데, 이게 허풍인지 예언인지는... 앞으로 5년이 증명하겠죠."
다만 하사비스는 낙관론 일색만은 아니었습니다. AI 안전 문제에 대해서도 명확한 경고를 남겼는데요. "AI가 똑똑해질수록 우리가 설계한 안전장치를 우회할 가능성이 커진다"며, 이를 막는 것 자체가 기술적으로 매우 어려운 숙제가 될 것이라고 짚었습니다. 성능과 안전이라는 두 마리 토끼를 동시에 잡아야 하는 딜레마가 앞으로 업계 전체의 숙제가 될 것으로 보입니다.
AI 업계에서 요즘 가장 뜨거운 논쟁 중 하나가 바로 이것입니다. LLM(대형 언어 모델)이 앞으로 더 거대한 AGI 시스템의 한 구성 요소로 편입될 것인가, 아니면 LLM 자체가 AGI 시스템의 전부가 될 것인가. 쉽게 말하면, LLM이 주연이냐 조연이냐의 문제입니다.
하사비스는 LLM이 단순히 상품화(commoditization)될 것이라는 시각을 거부했습니다. 특정 기업이나 모델이 시장을 독점하지 않고 LLM 자체가 전기나 인터넷처럼 평범한 인프라로 전락할 것이라는 전망이 있는데, 그는 이에 동의하지 않습니다. 오히려 스케일링을 통해 LLM이 AGI 시스템 전체의 핵심으로 남을 수 있다는 쪽에 무게를 뒀습니다.
흥미로운 건 샘 알트먼의 시각도 비슷한 방향을 가리킨다는 점입니다. 알트먼은 최근 라이브에서 "지금의 AI는 연속적인 학습과 장기 기억만 빠져 있을 뿐, 이미 AGI처럼 느껴진다"고 발언해 화제가 됐습니다. 그는 현재의 AI 발전 속도가 역사적 변곡점과 맞먹는 수준이며, 대중과 정치권이 미리 논의하고 대비할 시간이 필요하다고 경고했습니다.
이에 더해 AI 코딩 분야에서도 가시적인 변화가 나타나고 있습니다. GLM 계열 모델에서 파생된 최신 코딩 모델이 SWE-Bench Pro에서 58.4점을 기록, 현존 모든 모델 중 최고 성능을 달성했으며 오픈소스 부문 1위, 글로벌 3위를 차지했습니다. 텍스트 생성을 넘어 실질적인 코드 생산성에서도 LLM의 진화가 빠르게 이뤄지고 있음을 보여주는 사례입니다.
AI 모델이 아무리 뛰어나도 실제로 쓸 수 없으면 의미가 없습니다. 그 가장 큰 걸림돌이 바로 KV 캐시(Key-Value Cache) 문제였는데요. AI가 긴 문맥을 처리하려면 중간 연산 결과를 메모리에 계속 쌓아둬야 하는데, 이게 엄청난 VRAM을 잡아먹습니다. 결국 처리 중 메모리가 꽉 차는 아웃오브메모리(OOM) 현상이 터지고, AI 계산이 뚝 멈추는 일이 비일비재했습니다.
엔비디아가 이번에 공개한 TriAttention은 이 문제를 알고리즘 차원에서 정면 돌파합니다. KV 캐시를 무려 10.7배 압축하면서도 모델 성능 저하는 최소화했다는 게 핵심입니다. 실제 적용 시 32B(320억 파라미터) 규모의 대형 모델도 24GB VRAM GPU 한 장으로 구동이 가능해졌다고 하는데, 이게 얼마나 대단한 일인지 감이 오시나요? 지금까지는 그 정도 모델을 돌리려면 수십만 원짜리 GPU를 여러 장 묶어야 했거든요.
"막대한 하드웨어 증설 없이 알고리즘 최적화만으로 AI 구동 효율을 극대화할 수 있다는 방향성, 이게 바로 TriAttention이 보여주는 청사진입니다. 앞으로 대규모 AI 모델과 검색 엔진의 운영 비용이 어디까지 내려갈지 주목할 만합니다."
여기서 흥미로운 부분이 또 있습니다. 연구진이 AI 연산 과정에서 블랙박스처럼 불투명했던 내부 구조 안에서 수학적·물리적으로 일관된 질서를 발견했다는 점입니다. 이 발견이 TriAttention의 이론적 기반이 됐다고 하는데요. AI를 이해하는 방식 자체가 바뀌고 있다는 신호로도 읽힙니다.
투자자 관점에서도 이 기술은 주목할 포인트입니다. 단순히 GPU를 더 팔기 위한 기술이 아니라, 기존 하드웨어에서 더 많은 것을 뽑아내는 소프트웨어·알고리즘 영역으로 엔비디아의 경쟁력이 확장되고 있다는 의미이기 때문입니다.
AI 패권 경쟁의 무대가 모델 성능에서 물리적 인프라로 이동하고 있습니다. 핵심 단위도 달라졌습니다. 예전에는 "GPU 몇 장"이라고 했다면, 이제는 "기가와트(GW) 단위"로 이야기합니다. 그만큼 AI 연산에 들어가는 전력 소비가 국가 기간산업 수준으로 커진 것입니다.
앤스로픽은 최근 구글, 브로드컴과의 파트너십 확대를 공식 발표했습니다. 구글의 차세대 TPU를 대규모로 확보하고, AWS 트레이니움·구글 TPU·엔비디아 GPU를 혼합해 활용하는 멀티칩 전략을 채택했습니다. 특정 하드웨어에 의존하지 않고 여러 칩을 유연하게 활용해 비용 효율을 높이고 리스크를 분산하는 방식입니다.
샘 알트먼도 같은 맥락의 경고를 내놨습니다. 데이터센터 등 컴퓨팅 인프라가 충분히 구축되지 않으면, 결국 자본력을 가진 대형 기업과 부유층만이 AI 자원을 독점하는 구조가 고착화될 것이라는 우려입니다. AI 기술의 혜택이 골고루 퍼지려면 인프라 확장이 선행돼야 한다는 논리입니다.
이 모든 흐름을 종합하면, AI 산업의 경쟁 축이 "누가 더 똑똑한 모델을 만드냐"에서 "누가 더 많은 전기와 인프라를 확보하냐"로 빠르게 이동하고 있음을 알 수 있습니다. 모델 성능 경쟁이 아직 끝난 건 아니지만, 그 위에 물리적 인프라 경쟁이 새롭게 올라탄 형국입니다.
솔직히 말하면, 이번 주 AI 뉴스들을 정리하면서 가장 인상 깊었던 건 하사비스의 인터뷰였습니다. "스케일링은 아직 끝나지 않았다"는 발언이 단순한 자기 회사 PR인지, 아니면 업계 내부에서 실제로 체감하는 이야기인지 궁금해지더라고요.
한 가지 분명한 건, AGI를 둘러싼 논쟁이 더 이상 추상적인 학술 토론이 아니라는 점입니다. TriAttention처럼 지금 당장 GPU 한 장으로 32B 모델을 돌릴 수 있게 해주는 기술이 나오고, 앤스로픽이 기가와트 단위의 인프라를 깔기 시작했으며, 정체불명의 모델이 벤치마크 1위를 찍는 일이 현실에서 벌어지고 있습니다.
특히 AI 인프라 투자 흐름은 시장 참여자들 사이에서도 관심이 집중되고 있습니다. 반도체, 전력, 데이터센터 관련 섹터가 이 구조적 변화의 수혜권에 놓인다는 시각이 많아지고 있는데, 단기 모멘텀보다는 이 인프라 경쟁이 어떤 방향으로 수렴될지 중장기 관점에서 추이를 지켜볼 필요가 있어 보입니다.
과연 2031년 전후, 하사비스의 예언은 현실이 될까요? 앞으로도 이 흐름을 계속 함께 살펴봐요, 여러분~
투자 유의사항
본 글은 정보 제공 목적으로 작성되었으며, 특정 종목에 대한 투자 권유가 아닙니다. 투자 판단과 그에 따른 결과는 투자자 본인에게 있으며, 본 블로그는 어떠한 투자 손실에 대해서도 책임을 지지 않습니다. 주식 투자는 원금 손실의 위험이 있으므로 신중하게 판단하시기 바랍니다.
© OHMY개미 | 본 콘텐츠의 무단 복제 및 배포를 금합니다. | 이미지 출처: Pexels (royalty-free)
| AI가 27년 묵은 보안 구멍을 뚫었다 (0) | 2026.04.08 |
|---|---|
| 샘 알트먼의 '로봇세' 제안, AI 시대 일자리 대책의 진짜 속내는? (0) | 2026.04.08 |
| 정체불명 AI가 Seedance 2.0 제쳤다...HappyHorse-1.0의 정체는? (0) | 2026.04.08 |
| 메타 라마, 오픈소스 AI 판을 뒤흔든다 (0) | 2026.04.07 |
| 구글 Gemma 4 공개, AI 판이 완전히 바뀌었다 (0) | 2026.04.06 |