
“앤트로픽, LLM 내부 작동 방식 일부 파악…”사람처럼 실제 추론·추상화 실행””
이 기사는 앤트로픽이 대형언어모델(LLM)의 내부 작동 방식을 분석하는 기술을 개발하여 ‘클로드’의 작업 수행 과정을 통해 몇 가지 새로운 특징을 발견했다는 내용을 다루고 있습니다.
- 앤트로픽은 LLM이 작업을 수행할 때 활성화되는 경로를 분석하는 ‘회로 추적’ 기술을 개발했습니다.
- LLM이 답을 생성하기 전에 미리 계획하고, 여러 단계를 거친 논리적 추론을 수행하며, 응답을 생성하기 전 ‘개념’을 추상적 표현으로 변환한다는 사실을 밝혀냈습니다.
- LLM이 헛소리를 출력하는 과정과 환각을 일으키는 이유도 분석했습니다.
- 이 연구는 LLM의 안전 문제를 효과적으로 점검하고 조정할 수 있는 가능성을 열어준다고 설명합니다.
사람의 신체에서 가장 복잡한 뇌 연구가 끝판왕이라 생각되는데, 이제 인공지능의 뇌도 열어볼 정도로 기술이 나날이 발전하고 있네요…
- LLM의 내부 작동 방식에 대한 이해가 깊어짐에 따라, LLM의 안전성과 신뢰성을 향상시킬 수 있을 것으로 예상되며, LLM이 인간의 사고 과정을 모방하는 능력이 더욱 발전하여, 보다 정교하고 복잡한 작업을 수행할 수 있게 될 것으로 기대되네요.


“타이핑 없이 느낌으로 코딩하는 시대…’바이브코딩’오나”
이 기사는 AI를 활용한 소프트웨어 개발 방식인 ‘바이브 코딩‘에 대해 논의합니다. AI 기술의 발전으로 소프트웨어 개발 방식이 크게 변화하고 있으며, 오픈AI의 공동 창립자인 안드레이 카파시는 자연어와 음성 명령을 통해 AI에 코드 작성을 지시하는 ‘바이브 코딩’ 개념을 소개했습니다.
AI 도구는 UI 변경, 버그 수정, 코드 검토 등의 작업을 수행할 수 있으며, 이를 통해 생산성 향상과 비개발자도 애플리케이션을 만들 수 있는 기회를 제공합니다.
하지만 코드 품질, 보안 취약점, AI 생성 코드의 장기적인 유지 보수 문제 등 우려도 있습니다. 그럼에도 불구하고 Google, Microsoft, Amazon 등 주요 기술 기업들이 AI 기반 개발 도구를 개발하고 있어, AI 지원 개발이 주요 트렌드가 되고 있습니다.
AI가 생활이 침투하는 속도가 정말 빠르네요…..
- 미래에는 AI가 소프트웨어 개발에서 더욱 중요한 역할을 할 것으로 예상됩니다. AI가 인간 개발자를 완전히 대체하지는 않겠지만, 개발자의 역할을 바꿀 것입니다.
- AI를 효과적으로 사용하고, 명확한 지침을 제공하며, 비즈니스 요구와 기술적 솔루션을 결합하는 능력이 중요한 기술이 될 것입니다.
- AI 생성 코드의 품질과 유지 보수에 대한 우려가 있지만, AI 기술의 발전으로 점차 더 안정적이고 능력 있는 AI가 될 것으로 예상됩니다. 이는 개발 주기 단축, 비용 절감, 비기술 사용자의 소프트웨어 개발 참여 확대 등으로 이어질 수 있습니다.


“엔비디아, 트랜스포머의 순차 계산 문제 해결하는 ‘FFN 퓨전’ 아키텍처 공개”
엔비디아는 대형언어모델(LLM)의 순차적 계산 문제를 해결하기 위해 ‘FFN 퓨전’ 아키텍처를 개발했습니다. FFN 퓨전은 트랜스포머 모델의 피드 포워드 네트워크(FFN)의 순차적 처리로 인해 발생하는 비효율성을 개선하기 위해 고안되었습니다.
이 기술은 여러 연속적인 FFN 레이어를 하나의 더 넓은 FFN으로 결합하여 병렬 처리를 가능하게 함으로써 계산 시간을 줄이고 성능을 향상시킵니다. 엔비디아 연구진은 ‘라마-3.1-405B-인스트럭트’ 모델에 FFN 퓨전을 적용하여 성능과 효율성을 크게 향상한 ‘울트라-253B-베이스‘를 개발했습니다.
테스트 결과, 울트라-253B-베이스는 추론 지연 시간을 1.71배 향상시키고, 배치 크기 32에서 토큰당 계산 비용을 35배 절감하는 성과를 보였습니다. 또한, 다양한 벤치마크에서 ‘라마-3.1-405B-인스트럭트’와 비슷하거나 능가하는 성능을 나타냈으며, 메모리 사용량도 2배 절감되었습니다.
FFN 퓨전은 더 큰 모델에서 더 효과적이며, 양자화 및 가지치기와 같은 기존 최적화 기술을 보완할 수 있습니다. 엔비디아는 어텐션과 FFN 레이어를 모두 포함하는 전체 변압기 블록조차도 병렬화될 수 있음을 확인하여 신경 구조 설계에 대한 새로운 방향을 제시했습니다.
FFN 퓨전이 대형언어모델의 성능과 효율성을 크게 향상시킬 수 있는 잠재력을 보여주었네요. 큰 대형 모델에서 더 효과적이며, 양자화 및 가지치기와 같은 기존 최적화 기술을 보완하여, 향후 더욱 효율적인 대형언어모델의 개발로 이어질 것으로 기대되네요.


“‘눈빠지게 안봐도 된다’…인공지능 단 CCTV, 감시 넘어 판단까지”
에스원이 개발한 SVMS CCTV는 인공지능(AI) 에이전트 기술을 탑재하여 음성 검색으로 영상 검색이 가능한 스마트 비디오 매니지먼트 시스템입니다. 이 시스템은 거대언어모델(LLM) 기반의 대화형 영상관제 기술과 영상 언어모델을 융합하여 실시간 및 과거 영상 검색, 데이터 변환, 이상행동 분석, 표준 운영 절차 제공 등 다양한 기능을 수행합니다. 이를 통해 보안 인력의 업무 효율성을 높이고, 실시간 감시 및 대응 능력을 향상시킬 수 있다고 합니다.
에스원의 SVMS CCTV 개발은 단순 감시를 넘어 상황 판단 및 대응까지 가능한 AI 기반 CCTV 시스템의 미래를 보여주네요. 이러한 기술 발전은 “개인정보 보호 및 윤리적 문제”에 큰 변화를 가져올 것으로 예상되네요.


“중국, 자율주행 무인 드론 첫 인증… ‘저고도 경제’ 서막 올랐다“
중국 당국이 승객 수송용 자율주행 무인기(드론)에 첫 운항 인증서를 발급했습니다. 인증을 받은 드론은 ‘EH216-S’로, 무인 전기 수직 이착륙기(eVTOL)이며, 이항 홀딩스와 허페이 허이 항공이 공동 개발했습니다.
이 드론은 도시 항공 이동, 물류, 관광 등 다양한 분야에서 활용될 것으로 예상됩니다. 중국은 ‘저고도 경제’ 규모가 200조 원에 달할 것으로 전망하며, 관련 산업 육성에 적극적으로 나서고 있습니다. 향후 2~3년 내에 중국 주요 도시에서 드론 택시와 같은 저고도 경제 활동이 본격화될 것으로 예상됩니다.
중국이 자율주행 드론 택시를 상용화함으로써 저고도 경제를 선도하려는 움직임을 보이고 있네요. 이는 단순한 교통수단을 넘어, 물류, 관광 등 다양한 산업 분야에 혁신을 가져올 잠재력을 지니고 있습니다.
중국 정부의 적극적인 지원과 기술 개발을 통해 저고도 경제가 빠르게 성장할 것으로 예상됩니다. 저고도 경제의 성장은 새로운 산업 생태계와 일자리 창출에 기여할 수 있습니다.