본문으로 바로가기
제미나이.
Total 2
New
인간처럼 이해하고, 인간처럼 행동하는 멀티모달 AI

얼핏 막연해 보이는 이런 상상은 의외로 실현 가능성이 낮지 않다. 그리고 이 모든 것을 가능하게 하는 것이 바로 텍스트, 이미지, 음성 등 서로 다른 형태의 데이터를 통합해 처리하는 멀티모달 AI(Multimodal AI)다. 최근 전 세계 AI 업계가 주목하는 멀티모달 LLM(대규모 언어모델, Large Language Model) 군비 경쟁은 다양한 형태의 데이터를 하나의 맥락을 엮어, AI가 더욱 인간적으로 자연스럽게 상호작용하는 데 집중하고 있다.

2024. 12. 18

구글의 AI는 자비스를 꿈꾸고 있을까?

챗GPT를 발표해 세상을 놀라게 했던 오픈AI가 챗GPT의 새 버전 ‘GPT-4o’를 깜짝 발표했다. GPT-4o의 가장 큰 특징은 지금까지 키보드로 소통해야 했던 대화형 AI에 사람의 말을 알아듣고 반응하는 ‘음성 대화’ 기능을 추가했다는 점이었다.

2024. 07. 05