Chapter 2: 주요 도구와 생태계
학습 목표
- 주요 텍스트 생성 AI(ChatGPT, Claude, Gemini)의 특징과 차이를 비교할 수 있다
- 이미지 생성 AI(DALL-E, Midjourney, Stable Diffusion)의 특성을 이해한다
- 목적과 상황에 맞는 적절한 도구를 선택할 수 있다
- 각 도구의 강점과 약점을 파악하여 효과적으로 활용할 수 있다
1. 텍스트 생성 AI 비교
주요 3대 서비스 개요
현재 가장 널리 사용되는 텍스트 생성 AI는 ChatGPT, Claude, Gemini입니다.
| 서비스 |
개발사 |
최신 모델 (2026년 3월) |
출시 |
| ChatGPT |
OpenAI |
GPT-5.4, GPT-5.4 mini/nano, o3, o4-mini |
2022.11 |
| Claude |
Anthropic |
Claude Opus 4.6, Sonnet 4.6, Haiku 4.5 (1M 컨텍스트) |
2023.03 |
| Gemini |
Google |
Gemini 3.1 Pro (Preview), Gemini 2.5 Pro, 2.0 Flash |
2023.12 |
텍스트 생성 AI 시장 현황
| 서비스 |
시장 포지션 |
주요 특징 |
| ChatGPT (OpenAI) |
선두 주자 |
가장 큰 사용자 기반, 플러그인/GPTs 생태계 |
| Claude (Anthropic) |
빠른 성장 |
긴 컨텍스트 윈도우, 안전성 중시 |
| Gemini (Google) |
검색 연동 강점 |
Google 생태계 통합, 멀티모달 강점 |
2. ChatGPT 상세 분석
기본 정보
| 항목 |
내용 |
| 개발사 |
OpenAI |
| 무료 버전 |
GPT-5.4 nano (제한) |
| 유료 버전 |
Go ($8/월), Plus ($20/월), Pro ($200/월) |
| API |
사용량 기반 과금 |
| 컨텍스트 윈도우 |
128K 토큰 |
강점
| 강점 |
설명 |
| 범용성 |
대부분의 작업에서 안정적인 성능 |
| 생태계 |
GPTs, 플러그인, API 등 풍부한 확장 기능 |
| 사용자 기반 |
가장 많은 사용자 = 풍부한 활용 사례와 팁 |
| 멀티모달 |
이미지 인식, DALL-E 통합, 음성 대화 |
| 코드 인터프리터 |
Python 코드 실행, 데이터 분석 가능 |
약점
| 약점 |
설명 |
| 학습 데이터 시점 |
특정 시점까지의 데이터만 학습 (웹 검색으로 보완) |
| 환각 |
다른 모델과 마찬가지로 사실 오류 발생 |
| 긴 문서 처리 |
Claude 대비 컨텍스트 윈도우 작음 |
| 가격 |
API 사용 시 비용이 빠르게 증가할 수 있음 |
주요 기능
GPTs (커스텀 챗봇)
사용자가 특정 목적에 맞게 ChatGPT를 커스터마이징할 수 있는 기능입니다.
| GPT 유형 |
활용 목적 |
| 글쓰기 전문 GPT |
특정 스타일/톤으로 글 작성 최적화 |
| 데이터 분석 GPT |
엑셀/CSV 파일 분석에 특화 |
| 이미지 생성 GPT |
DALL-E 프롬프트 자동 최적화 |
| 학습 도우미 GPT |
특정 과목/분야 튜터링 |
웹 브라우징
실시간 인터넷 검색을 통해 최신 정보를 참조할 수 있습니다.
웹 브라우징 활용
"최신 정보를 검색해서 답변해줘"라고 요청하면 웹 검색 기능이 활성화됩니다. 단, 검색 결과의 정확성은 여전히 검증이 필요합니다.
3. Claude 상세 분석
기본 정보
| 항목 |
내용 |
| 개발사 |
Anthropic |
| 무료 버전 |
Claude Sonnet 4.6 (사용량 제한) |
| 유료 버전 |
Pro ($20/월), Max 5x ($100/월), Max 20x ($200/월) |
| API |
Sonnet $3/$15, Opus $5/$25 (1M 토큰당 입력/출력) |
| 컨텍스트 윈도우 |
1M 토큰 (업계 최대 수준) |
강점
| 강점 |
설명 |
| 긴 컨텍스트 |
1M 토큰 = 약 2,500페이지 분량 처리 가능 |
| 문서 분석 |
긴 PDF, 논문, 계약서 분석에 탁월 |
| 글쓰기 품질 |
자연스럽고 세련된 문체 |
| 안전성 |
Constitutional AI로 유해 콘텐츠 생성 최소화 |
| 코딩 |
코드 생성 및 리뷰에서 높은 성능 |
약점
| 약점 |
설명 |
| 이미지 생성 불가 |
텍스트 전용 (이미지 분석·인라인 시각화는 가능) |
| 생태계 |
ChatGPT 대비 적었으나 빠르게 성장 중 (MCP, Claude Code) |
| 지역 제한 |
일부 국가에서 접속 제한 |
Constitutional AI란?
Constitutional AI
Anthropic이 개발한 AI 안전 기법입니다. AI가 스스로 출력을 검토하고 해로운 내용을 수정하도록 훈련됩니다. 이로 인해 Claude는 유해하거나 편향된 콘텐츠 생성을 상대적으로 잘 거부합니다.
웹 검색 기능
Claude는 2025년부터 웹 검색 기능을 지원합니다. 무료 플랜에서도 사용 가능하며, 실시간 정보를 검색하여 답변에 반영합니다.
Claude 웹 검색
이전에는 학습 데이터 시점까지의 정보만 사용할 수 있었지만, 현재는 웹 검색으로 최신 정보에 접근할 수 있습니다. 다만 Google 검색 연동인 Gemini에 비해서는 검색 범위가 제한적입니다.
Claude Code & 에이전트 기능
Claude Code는 터미널에서 직접 코딩 작업을 수행하는 에이전트 도구입니다. Pro 이상 플랜에서 사용 가능합니다. 최근에는 Cowork(영구 에이전트 스레드)와 음성 모드도 추가되어 협업·대화 경험이 확장되고 있습니다.
| 기능 |
설명 |
| 터미널 코딩 |
CLI에서 직접 코드 작성·실행·디버깅 |
| 파일 시스템 접근 |
프로젝트 파일 직접 읽기/쓰기 |
| Git 연동 |
커밋, PR 생성, 코드 리뷰 자동화 |
| Computer Use |
컴퓨터 화면을 직접 보고 조작하는 에이전트 |
| Cowork |
영구 에이전트 스레드로 지속적 협업 가능 |
Artifacts 기능
Claude의 특징적 기능으로, 코드, 문서, 다이어그램 등을 별도 패널에서 실시간으로 생성하고 편집할 수 있습니다.
| Artifact 유형 |
활용 방법 |
| 코드 작성 |
별도 패널에서 코드 생성, 실시간 수정 가능 |
| 문서 작성 |
마크다운 문서 실시간 렌더링 |
| 차트 생성 |
SVG 기반 다이어그램 생성 |
| 웹페이지 |
HTML/CSS/JS로 간단한 웹페이지 프로토타입 |
4. Gemini 상세 분석
기본 정보
| 항목 |
내용 |
| 개발사 |
Google DeepMind |
| 무료 버전 |
Gemini 2.0 Flash |
| 유료 버전 |
Gemini Advanced ($19.99/월), AI Pro ($30/월), AI Ultra ($50/월) |
| API |
Google AI Studio, Vertex AI |
| 컨텍스트 윈도우 |
1M+ 토큰 (업계 최대) |
강점
| 강점 |
설명 |
| Google 통합 |
Gmail, Docs, Drive 등 Google 서비스 연동 |
| 실시간 검색 |
Google 검색 엔진 직접 연동 |
| 멀티모달 |
텍스트, 이미지, 오디오, 비디오 동시 처리 |
| 긴 컨텍스트 |
1M 토큰 = 약 2,500페이지 분량 |
| 가격 |
무료 버전도 상당히 강력 |
약점
| 약점 |
설명 |
| 언어별 품질 차이 |
영어 대비 한국어 성능이 상대적으로 낮을 수 있음 |
| 일관성 |
같은 질문에 대해 답변 변동이 있을 수 있음 |
| 생태계 |
ChatGPT 대비 서드파티 앱/플러그인 부족 |
| 환각 |
검색 연동에도 사실 오류 발생 가능 |
Google Workspace 통합
Gemini for Google Workspace
Gmail, Docs, Sheets, Slides 등에서 직접 Gemini를 사용할 수 있습니다. 이메일 초안 작성, 문서 요약, 스프레드시트 분석 등을 해당 앱 내에서 바로 수행할 수 있습니다.
5. 3대 서비스 종합 비교
기능별 비교표
| 기능 |
ChatGPT |
Claude |
Gemini |
| 텍스트 생성 |
⭐⭐⭐⭐⭐ |
⭐⭐⭐⭐⭐ |
⭐⭐⭐⭐ |
| 코딩 |
⭐⭐⭐⭐⭐ |
⭐⭐⭐⭐⭐ |
⭐⭐⭐⭐ |
| 긴 문서 분석 |
⭐⭐⭐ |
⭐⭐⭐⭐⭐ |
⭐⭐⭐⭐⭐ |
| 이미지 생성 |
⭐⭐⭐⭐⭐ |
❌ |
⭐⭐⭐⭐ |
| 이미지 분석 |
⭐⭐⭐⭐⭐ |
⭐⭐⭐⭐ |
⭐⭐⭐⭐⭐ |
| 실시간 정보 |
⭐⭐⭐⭐⭐ |
⭐⭐⭐ |
⭐⭐⭐⭐⭐ |
| 한국어 |
⭐⭐⭐⭐ |
⭐⭐⭐⭐ |
⭐⭐⭐⭐ |
| 안전성 |
⭐⭐⭐⭐ |
⭐⭐⭐⭐⭐ |
⭐⭐⭐⭐ |
| 에이전트/자동화 |
⭐⭐⭐ |
⭐⭐⭐⭐⭐ |
⭐⭐⭐ |
| 생태계/확장 |
⭐⭐⭐⭐⭐ |
⭐⭐⭐⭐ |
⭐⭐⭐⭐ |
가격 비교 (2026년 3월 기준)
| 서비스 |
무료 |
유료 |
API (입력/출력 per 1M 토큰) |
| ChatGPT |
GPT-5.4 nano (제한) |
Go $8 / Plus $20 / Pro $200/월 |
모델별 상이 |
| Claude |
Sonnet 4.6 (제한) |
Pro $20 / Max $100~200/월 |
$3 / $15 (Sonnet 4.6) |
| Gemini |
2.0 Flash |
$19.99/월 |
$1.25 / $10 (2.5 Pro) |
가격 변동 주의
AI 서비스 가격은 자주 변경됩니다. 최신 가격은 각 서비스 공식 사이트에서 확인하세요.
6. 용도별 추천 도구
상황별 최적 도구
| 용도 |
1순위 |
이유 |
| 일반 대화/질문 |
ChatGPT |
범용성, 안정성 |
| 긴 문서 분석 |
Claude |
1M 토큰 컨텍스트 |
| 논문/계약서 검토 |
Claude |
긴 문서 + 세밀한 분석 |
| 최신 정보 검색 |
Gemini |
Google 검색 연동 |
| 코딩/개발 |
Claude (Claude Code) 또는 ChatGPT |
Claude Code 에이전트 기능 강점 |
| 이미지 생성 |
ChatGPT (DALL-E) |
통합 이미지 생성 |
| Google 업무 |
Gemini |
Workspace 통합 |
| 안전한 콘텐츠 |
Claude |
Constitutional AI |
📌 사례: 도구 선택 실전 예시
사례 1: 100페이지 PDF 계약서 검토
| ❌ 부적절한 선택: ChatGPT |
✅ 적절한 선택: Claude |
| 128K 토큰으로 전체 문서 처리 어려움 |
1M 토큰으로 전체 문서 한 번에 처리 |
| 문서를 나눠서 업로드해야 함 |
문서 전체 맥락 유지 |
| 맥락 유지 어려움 |
법률 문서 분석에 강점 |
사례 2: 오늘 발표된 뉴스 요약
| 선택지 A: Claude |
✅ 적절한 선택: Gemini |
| 웹 검색 가능하나 범위 제한적 |
Google 검색 실시간 연동 |
| 기본적인 최신 뉴스 검색 가능 |
최신 뉴스 직접 검색 및 요약, 출처 강점 |
사례 3: 마케팅 이미지 제작
| ❌ 부적절한 선택: Claude |
✅ 적절한 선택: ChatGPT + DALL-E |
| 이미지 생성 기능 없음 |
대화 중 바로 이미지 생성 |
| 텍스트 전용 서비스 |
텍스트와 이미지 작업 통합 |
7. 이미지 생성 AI
주요 이미지 생성 도구
| 도구 |
개발사 |
특징 |
접근 방식 |
| DALL-E 3 |
OpenAI |
ChatGPT 통합, 자연어 프롬프트 |
웹/API |
| Midjourney |
Midjourney |
예술적 스타일, 고품질 |
Discord |
| Stable Diffusion |
Stability AI |
오픈소스, 로컬 실행 가능 |
로컬/웹 |
| Imagen |
Google |
Gemini 통합 |
웹/API |
이미지 생성 도구 비교
| 항목 |
DALL-E 3 |
Midjourney |
Stable Diffusion |
| 품질 |
⭐⭐⭐⭐ |
⭐⭐⭐⭐⭐ |
⭐⭐⭐⭐ |
| 사용 편의성 |
⭐⭐⭐⭐⭐ |
⭐⭐⭐ |
⭐⭐ |
| 가격 |
ChatGPT Plus 포함 |
$10-30/월 |
무료 (로컬) |
| 스타일 |
다양함, 범용적 |
예술적, 세련됨 |
커스텀 가능 |
| 텍스트 렌더링 |
⭐⭐⭐⭐⭐ |
⭐⭐⭐ |
⭐⭐⭐ |
| 제어력 |
중간 |
높음 |
매우 높음 |
이미지 프롬프트의 기본 구조
[주제] + [스타일] + [분위기] + [기술적 요소]
예시:
"A serene mountain landscape at sunset,
in the style of Studio Ghibli,
warm colors, soft lighting,
8K resolution, highly detailed"
이미지 프롬프트 팁
- 구체적으로: "꽃" → "빨간 장미 한 송이, 이슬방울이 맺힌"
- 스타일 지정: "사실적인", "수채화 스타일", "미니멀리즘"
- 기술적 품질: "8K", "highly detailed", "professional photo"
8. 기타 주목할 도구들
Perplexity AI - AI 검색의 새로운 패러다임
| 항목 |
내용 |
| 개발사 |
Perplexity AI |
| 핵심 기능 |
실시간 웹 검색 + AI 요약 + 출처 명시 |
| 무료 버전 |
일일 검색 제한, 기본 모델 |
| Pro 버전 |
$20/월, GPT-5.4/Claude 4.6 선택 가능 |
강점:
| 강점 |
설명 |
| 실시간 정보 |
최신 뉴스, 이벤트 정보 즉시 검색 |
| 출처 명시 |
모든 답변에 참조 URL 자동 표시 |
| 팩트 중심 |
환각 위험 감소, 검증 가능한 정보 제공 |
| Focus 기능 |
학술, 뉴스, YouTube 등 검색 범위 지정 |
사용 추천 상황:
✅ 추천하는 경우:
- 최신 뉴스나 이벤트 정보가 필요할 때
- 출처 확인이 중요한 리서치 작업
- 팩트체킹이 필요한 정보 검색
- 여러 출처를 종합한 요약이 필요할 때
❌ 다른 도구가 나은 경우:
- 창작 글쓰기, 코딩 (ChatGPT, Claude 권장)
- 긴 문서 분석 (Claude, Gemini 권장)
- 이미지 생성 (ChatGPT DALL-E, Midjourney 권장)
Microsoft Copilot - Office 업무의 AI 비서
출시: 2023년 2월 (Bing Chat → Copilot 리브랜딩)
| 항목 |
내용 |
| 개발사 |
Microsoft (OpenAI 기술 기반) |
| 핵심 기능 |
Microsoft 365 생태계 통합 AI |
| 무료 버전 |
기본 대화, 웹 검색, 이미지 생성 |
| Pro 버전 |
$20/월, Office 앱 내 AI 기능 |
Office 통합 기능:
| 앱 |
AI 기능 |
| Word |
문서 초안 생성, 내용 요약, 톤 변경 |
| Excel |
데이터 분석, 수식 제안, 인사이트 추출 |
| PowerPoint |
슬라이드 자동 생성, 디자인 제안 |
| Outlook |
이메일 요약, 답장 초안, 일정 관리 |
| Teams |
회의 요약, 액션 아이템 추출 |
사용 추천 상황:
✅ 추천하는 경우:
- Microsoft 365를 주력으로 사용하는 경우
- Office 문서 내에서 바로 AI 활용이 필요할 때
- 이메일, 문서, 프레젠테이션 업무가 많을 때
- Windows 환경에서 통합 AI 경험을 원할 때
❌ 다른 도구가 나은 경우:
- Google Workspace 사용자 (Gemini 권장)
- 깊은 분석이나 긴 문서 처리 (Claude 권장)
- 코딩 작업 중심 (GitHub Copilot 권장)
특화 도구들
| 도구 |
용도 |
특징 |
가격 |
| Perplexity |
AI 검색 |
실시간 검색 + 출처 표시 |
무료~$20/월 |
| Microsoft Copilot |
Office 통합 |
Word, Excel, PPT 내 AI |
무료~$20/월 |
| Notion AI |
문서 작업 |
Notion 내 AI 통합 |
$10/월 추가 |
| GitHub Copilot |
코딩 |
IDE 내 코드 자동완성 |
$10/월 |
| Claude Code |
코딩 에이전트 |
터미널 기반 자율 코딩 |
Pro $20/월~ |
| Cursor |
코딩 |
AI 네이티브 에디터 |
무료~$20/월 |
| Grammarly |
글쓰기 |
문법 교정 + AI 작문 |
무료~$30/월 |
| Otter.ai |
회의록 |
음성 → 텍스트 변환 |
무료~$20/월 |
오픈소스 모델
| 모델 |
개발사 |
특징 |
| Llama 4 |
Meta |
Scout/Maverick 변형, 멀티모달 |
| GLM-5 |
Zhipu AI |
오픈소스 1위, 추론·코딩 최강 |
| DeepSeek-V3.2 |
DeepSeek |
추론·에이전트 특화, 프론티어급 |
| Qwen3-235B |
Alibaba |
대규모 오픈소스, 셀프호스팅 가능 |
| Mistral |
Mistral AI |
효율적, 유럽 기반 |
오픈소스 모델의 장점
로컬에서 실행 가능하여 데이터 프라이버시 보장, 커스터마이징 가능, 비용 절감. 단, 설치와 운영에 기술적 지식 필요.
9. 도구 선택 가이드
의사결정 플로우차트
| 작업 목적 |
추천 도구 |
| 텍스트 생성 |
ChatGPT, Claude, Gemini |
| 이미지 생성 |
DALL-E, Midjourney, Stable Diffusion |
| 최신 정보 검색 |
Gemini, Perplexity |
| 긴 문서 분석 |
Claude, Gemini |
선택 시 고려사항
| 고려사항 |
질문 |
| 목적 |
무엇을 달성하려는가? |
| 데이터 |
어떤 형태의 입력을 다루는가? (텍스트, 이미지, 문서) |
| 길이 |
처리해야 할 문서/텍스트의 길이는? |
| 최신성 |
실시간 정보가 필요한가? |
| 비용 |
예산 제약이 있는가? |
| 프라이버시 |
민감한 데이터를 다루는가? |
| 통합 |
기존 워크플로우와 통합이 필요한가? |
핵심 정리
이 챕터의 핵심 포인트
- ChatGPT: 범용성, 풍부한 생태계, DALL-E 통합
- Claude: 긴 컨텍스트(1M), 안전성, 문서 분석 강점
- Gemini: Google 통합, 실시간 검색, 멀티모달
- 도구 선택 기준: 목적, 데이터 형태, 문서 길이, 최신 정보 필요 여부
- 이미지 생성: DALL-E(편의성), Midjourney(품질), Stable Diffusion(자유도)
- 오픈소스: GLM-5, DeepSeek-V3.2 등이 상용 모델과 대등한 수준에 도달
- 핵심 원칙: 하나의 도구에 의존하지 말고, 목적에 맞는 도구 선택
생각해볼 질문
토론 질문
- 하나의 AI 도구만 사용한다면 어떤 것을 선택하겠는가? 그 이유는?
- 무료 버전과 유료 버전의 차이가 월 $20의 가치가 있는가?
- 오픈소스 모델과 상용 서비스 중 어느 것이 미래에 더 중요해질까?
- AI 도구 선택에서 가장 중요한 기준은 무엇이라고 생각하는가?
관련 위키 문서
참고 자료