말구링의 잡동사니

  • 홈
  • 태그
  • 방명록

2026/04/11 1

멀티모달 AI란? 텍스트·이미지·음성을 함께 쓰는 시대

AI 하면 텍스트 대화를 먼저 떠올리는 사람이 많습니다. 그런데 요즘 AI는 텍스트만 다루지 않습니다. 이미지를 보고 설명하고, 음성을 텍스트로 바꾸고, 그림을 그리고, 동영상을 분석합니다. 이처럼 여러 종류의 데이터를 함께 처리할 수 있는 AI를 멀티모달 AI라고 부릅니다.멀티모달이 뭔지 정확히 짚으면모달(Modality)은 데이터의 종류를 의미합니다. 텍스트, 이미지, 음성, 영상, 코드 각각이 하나의 모달입니다. 멀티모달은 이 중 두 가지 이상을 함께 처리할 수 있다는 뜻입니다.초기 LLM은 텍스트 입력에 텍스트 출력만 가능했습니다. 지금은 이미지를 입력으로 받거나, 음성으로 대화하거나, 텍스트 설명으로 이미지를 생성하는 것까지 하나의 모델에서 처리하는 방향으로 발전하고 있습니다. GPT-4o, C..

AI·자동화 2026.04.11
이전
1
다음
더보기
프로필사진

말구링의 잡동사니

말구링의 잡동사니 창고입니다.

  • 분류 전체보기 (30)
    • AI·자동화 (30)

Tag

최근글과 인기글

  • 최근글
  • 인기글

최근댓글

공지사항

페이스북 트위터 플러그인

  • Facebook
  • Twitter

Archives

Calendar

«   2026/04   »
일 월 화 수 목 금 토
1 2 3 4
5 6 7 8 9 10 11
12 13 14 15 16 17 18
19 20 21 22 23 24 25
26 27 28 29 30

방문자수Total

  • Today :
  • Yesterday :

Copyright © AXZ Corp. All rights reserved.

티스토리툴바