인간처럼 이해하고, 인간처럼 행동하는 멀티모달 AI
얼핏 막연해 보이는 이런 상상은 의외로 실현 가능성이 낮지 않다. 그리고 이 모든 것을 가능하게 하는 것이 바로 텍스트, 이미지, 음성 등 서로 다른 형태의 데이터를 통합해 처리하는 멀티모달 AI(Multimodal AI)다. 최근 전 세계 AI 업계가 주목하는 멀티모달 LLM(대규모 언어모델, Large Language Model) 군비 경쟁은 다양한 형태의 데이터를 하나의 맥락을 엮어, AI가 더욱 인간적으로 자연스럽게 상호작용하는 데 집중하고 있다.
2024. 12. 18
취향 저격 AI 서비스가 쏟아진다, GPT 스토어가 바꿀 일상
ChatGPT가 쏘아 올린 생성형 인공지능의 열기가 식을 줄을 모른다. 실리콘밸리 거대 기업들이 주도하는 치열한 경쟁 덕분에 그 기능과 성능이 나날이 향상되고 있으며, 글, 그림, 사진, 음성 등을 가리지 않고 만들어내는 멀티모달(multi-modal) 기능이 더해지면서, 인터넷과 스마트폰에 이어 인류의 새로운 도구로서 그 입지를 점점 굳혀가고 있다. 게다가 최근 OpenAI의 새로운 서비스인 GPT 스토어(GPT Store)가 출시되면서, 기존의 ChatGPT가 가지고 있던 여러 문제를 해결하고 AI 기술을 한 단계 더 발전시키는 중요한 전환점이 되고 있다. GPT 스토어는 어떠한 변화를 불러오는지, 그리고 그것이 우리에게 어떤 의미를 가지는지 살펴보도록 하자.
2024. 01. 30
2024년, 영화 ‘그녀’가 현실이 된다
AI와 모바일 디바이스의 만남으로 커다란 변화가 다가올 2024년. 과연 2024년엔 어떤 변화가 있을까? 결론부터 말하자면 2024년은 우리가 대형언어모델(LLM) 온디바이스 AI 스마트폰을 가질 수 있는 첫해가 될 것이다. 즉, 인공지능 스마트폰이 나와 대화를 한다는 뜻이다. 스마트폰은 이제 만지고 보는 기계가 아니라 말을 거는 기계가 될 것이다. 내년 모바일 디바이스가 어떻게 진화할지 궁금한 독자들을 위해 현재 진행 중인 주목할 만한 사례를 소개한다.
2023. 12. 13