AI스터디

Agent 구현 Step2_ Agent 사용

부자가 될거야 2025. 5. 10. 21:22

낼 결혼식이라 용케 오늘 조금 공부를 했다. 

 

나는 그지니까, 가성비 방법을 써보려 한다. 

 

구글링해봤을때, 많은 기업이나 개발자들이 비용 문제로 Agent 구축을 할 때 AWS 대신 LangChain, LlamaIndex, Haystack 같은 프레임워크를 활용하여 에이전트 기반 시스템을 구축한다고 한다. 

Agent 시스템 구축하기: 구성 요소와 오픈소스 대안

구성요소 역할 오픈소스/대체기술
LLM (Large Language Model) 지식 생성 / 계획 OpenAI GPT, Mistral, LLaMA, Mixtral, Command-R, Gemma, Nous Hermes 등
Planner 사용자 요청을 계획으로 나누기 LangChain Agent, AutoGen, CrewAI, MetaGPT
Tool 외부 도구 실행 (API, DB, 계산기 등) LangChain tools, PythonTool, RequestsTool, 사용자 정의 함수
Executor 계획에 따라 Tool 실행 LangChain AgentExecutor / AutoGen GroupChat
Memory (선택) 이전 대화 및 작업 결과 기억 LangChain Memory / Chroma / Weaviate
Retrieval (선택) Knowledge Base 검색 LlamaIndex, FAISS, Chroma, Weaviate
UI (선택) 사용자 인터페이스 Streamlit, Gradio, FastAPI, React

모델은 Huggingface 보단 OpenAi가 나을것 같다.

 

모르는 사람이 있을 수 있으니 알려주자면, Huggingface란 여러 모델들 / Fine-Tuned된 / Llama3 와 같은 오픈소스 모델들의 집합소라고 보면 될 것같다. 

사이트는 다음과 같다. https://huggingface.co/

 

다만, 이 모델을 돌리기 위해선 GPU가 필요한데, 우리집, 가정집 뿐만아니라 대부분의 사람들은 H100, A100과 같은 고-사양 GPU 가 없을테니 그런 GPU 를 '대여', '사용' 하는 클라우드를 쓰는 것이다.

 

그 예로는 Oracle, MS, AWS 등이 있을거고, 양자컴퓨터 회사들이 현재 나아가려는 방향도 비슷할 것으로 생각된다. (대여서비스)

이렇게 보면 옛날 만화방과 비슷한 개념으로 생각하면 되지 않을까?

우리집은 why, 그리스로마신화 이런거 안사줬었어서... 

 

아무튼, 

 

AWS 로 컨설팅을 받을때 Langchain 을 써보는 게 어떤지 물어본 적이 있었는데, 당시 회사 업무가 다른것도 많고 하다보니, 이미 Bedrock 로 구축된 환경 외 다른 공부를 할 시간이 없어 우선 되면 할게요~ 라고 했었던 기억이 난다. 

 

여기서도 Langchain 이 나오므로, 이게 어떤 건지 공부를 해보았다.

 

Langchain 이란? 

쉽게 말하면, Langchain 은 GPT 같은 LLM을 "쓸모 있는 앱" 으로 만들어주는 Python 라이브러리이다.

 

예시를 들어보자, 

GPT는 억수로 똑똑한 뇌만 둥 둥 있는 상태이다. 

Langchain 은 그 뇌가 생각을 하면 말을 하고, 역할을 부여하고, 어느정도 '사람구실' 할 수 있도록 하는 도구인거지. 

 

웹에서 정보 검색하고 요약 ❌ (GPT는 웹 접속 못함) ✅ DuckDuckGo tool로 검색 가능
엑셀 파일 분석 ✅ PandasTool로 분석 가능
여러 도구를 순차 실행 ✅ Agent로 자동 계획 + 실행
긴 문서에서 원하는 정보 찾기 ✅ RAG 구조로 문서 검색 가능
"날씨 확인 → 추천 옷차림 → 쇼핑몰 연결" 같은 복합작업 ✅ 여러 tool 연결한 에이전트가 처리

 

그럼 여기까지 보았을때, 엥 agent랑 langchain 이랑 뭐가 달라? 할 수도 있다.

 

  • LangChain은 GPT를 활용해 실제 앱을 만들기 위한 개발 프레임워크
  • Agent는 그 프레임워크 안에서 GPT가 능동적으로 문제 해결하는 실행 방식

쉽게 말하면 Langchain 안에 Agent가 있는거다.

너무 단순하게 말하긴 했는데, 

 

LangChain (틀, 전체 시스템)
├── Tool       ← GPT가 쓸 수 있는 계산기/검색기 등 도구
├── Memory     ← 대화 내용을 기억
├── Chain      ← 여러 단계를 연결 (예: 검색 → 요약 → 이메일 발송)
└── Agent      ← 위 도구들을 '스스로' 선택하고 순서를 계획함

 

이런 구조다. 즉 Langchain 안에 GPT 가 일할 수 있도록 '지휘자' 역할을 하는게 Agent

 

더어 쉽게 말하면, 내가 어떤 커피 시스템을 만든다 하자. 

 

 

  • LangChain = 카페 전체 시스템 (메뉴판, 바리스타, POS, 계산대)
  • Tool = 커피머신, 카드 결제기
  • Chain = “주문 → 결제 → 제조 → 알림” 순서 정의
  • Agent = 바리스타가 “누가 뭐 마시려는지 파악하고, 재료 꺼내서, 머신 켜고, 커피 내리고, 전달”까지 알아서 하는 것

 

Agent로 그럼 무엇을 해볼까? 

 

🥇 최적의 조합

요소 추천방식 이유
GPT 모델 OpenRouter + GPT-4 무료 티어 고성능 + 무료 API 사용 가능
Agent 시스템 LangChain Agent 가장 예제 많고, 쉽게 설정 가능
도구 구성 블로그 목차 생성, 본문 작성, 포맷 정리 도구 만들기 각 단계 나눠서 GPT에게 시키기
UI Streamlit 글쓰기 결과 바로 확인 가능 + 코드 간단
업로드 (선택) Tistory API 글 자동 게시 (나중에 추가 가능)

 

난 주식에 관심이 많으니, 주식과 관련된 글을 만들고, 분석하는 Agent를 만들어보자. 

 

어떻게 할지, 더 나아갈지는 다음에 진행하기로~!

 

Streamlit는 회사에서 써봤으니, 편하게 쓸 수 있을거서 같고, Agent가 얼마나 접근성이 좋은지는 확인해봐야할듯...

 

AWS 에서 제공한 Agent는 엄청 편하고 명확하게 Pipeline까지 구현되어있어 편했었는데, 직접 구성은 어떻게 할 수 있을지는 고민해보자.

 

'AI스터디' 카테고리의 다른 글

Agent 구현 Step1_ Agent란?  (4) 2025.05.07