주 콘텐츠로 건너뛰기

"인지 아키텍처" 태그가 붙은 하나의 게시물

모든 태그 보기

Google 에이전트 백서

· 1분 읽기
Lark Birdy
Chief Bird Officer

GPT-4와 Gemini 같은 언어 모델이 대화 능력으로 대중의 관심을 끌고 있는 동안, 더 깊은 혁명이 일어나고 있습니다: AI 에이전트의 부상입니다. Google의 최근 백서에 자세히 설명된 바와 같이, 이러한 에이전트는 단순한 스마트 챗봇이 아니라, 실제 세계를 능동적으로 인식하고, 추론하며, 영향을 미칠 수 있는 AI 시스템입니다.

AI 능력의 진화

전통적인 AI 모델을 인터넷이나 전화가 없는 방에 갇힌 매우 박식한 교수로 생각해 보세요. 그들은 뛰어난 통찰력을 제공할 수 있지만, 방에 들어가기 전에 배운 것에만 기반합니다. 반면, AI 에이전트는 최신 도구를 모두 사용할 수 있는 교수와 같습니다. 그들은 현재 정보를 검색하고, 이메일을 보내고, 계산을 하고, 복잡한 작업을 조정할 수 있습니다.

에이전트를 전통적인 모델과 구별하는 요소는 다음과 같습니다:

  • 실시간 정보: 모델이 훈련 데이터에 제한되는 반면, 에이전트는 외부 도구와 API를 통해 현재 정보를 액세스할 수 있습니다.
  • 행동 수행: 에이전트는 행동을 제안하는 것에 그치지 않고, 함수 호출과 API 상호작용을 통해 이를 실행할 수 있습니다.
  • 메모리 관리: 에이전트는 여러 상호작용에서 맥락을 유지하며, 각 교환에서 학습하여 응답을 개선합니다.
  • 도구 통합: 외부 도구와 API를 사용하는 능력이 그들의 아키텍처에 내재되어 있으며, 사후에 추가된 것이 아닙니다.

에이전트의 사고 방식: 인지 아키텍처

에이전트의 진정한 마법은 그들의 "인지 아키텍처"에 있습니다. 이는 그들이 어떻게 추론하고 결정을 내리는지를 지배하는 시스템입니다. 백서에서는 세 가지 주요 접근 방식을 설명합니다:

  1. ReAct: 에이전트가 상황에 대해 추론하고 구체적인 행동을 취하는 것을 번갈아 하는 프레임워크입니다. 요리사가 끊임없이 자신의 진행 상황을 평가하고 요리 전략을 조정하는 것을 상상해 보세요.

  2. Chain-of-Thought: 에이전트가 복잡한 문제를 더 작고 관리 가능한 단계로 나누어 작업을 보여줍니다. 이는 수학자가 복잡한 방정식을 단계별로 해결하는 것과 유사합니다.

  3. Tree-of-Thoughts: 에이전트가 여러 가능한 해결 경로를 동시에 탐색합니다. 이는 체스 선수가 다양한 움직임과 그 결과를 고려하는 것과 같습니다.

다음은 백서에서 에이전트가 항공편 예약 요청을 처리하는 방법의 실제 예입니다:

사용자: "오스틴에서 취리히로 가는 항공편을 예약하고 싶습니다"

에이전트 생각: 먼저 항공편을 검색해야 합니다
행동: [항공편 검색 API 호출]
관찰: 여러 항공편 옵션 발견

에이전트 생각: 최적의 가격과 경로를 확인해야 합니다
행동: [검색 결과 분석]
관찰: 최적의 연결과 가격 발견

에이전트 생각: 사용자가 명확한 옵션 요약을 필요로 합니다
최종 답변: "여기 최상의 항공편 옵션이 있습니다..."

에이전트의 도구 상자: 그들이 세상과 상호작용하는 방법

백서는 에이전트가 외부 시스템과 상호작용할 수 있는 세 가지 뚜렷한 방법을 식별합니다:

1. 확장

이들은 직접 API 호출을 허용하는 에이전트 측 도구입니다. 이를 에이전트의 손이라고 생각해 보세요. 그들은 외부 서비스와 직접 상호작용할 수 있습니다. Google의 백서는 이러한 도구가 항공편 가격 확인이나 일기 예보와 같은 실시간 작업에 특히 유용하다고 보여줍니다.

2. 함수

확장과 달리, 함수는 클라이언트 측에서 실행됩니다. 이는 더 많은 제어와 보안을 제공하여 민감한 작업에 이상적입니다. 에이전트는 수행할 작업을 지정하지만, 실제 실행은 클라이언트의 감독 하에 이루어집니다.

확장과 함수의 차이점:

3. 데이터 저장소

이들은 에이전트의 참조 라이브러리로, 구조화된 데이터와 비구조화된 데이터 모두에 접근할 수 있습니다. 벡터 데이터베이스와 임베딩을 사용하여 에이전트는 방대한 데이터셋에서 관련 정보를 빠르게 찾을 수 있습니다.

에이전트의 학습 및 개선 방법

백서는 에이전트 학습의 세 가지 흥미로운 접근 방식을 설명합니다:

  1. 맥락 내 학습: 새로운 레시피와 재료를 받은 요리사처럼, 에이전트는 런타임에 제공된 예제와 지침을 통해 새로운 작업을 처리하는 법을 배웁니다.

  2. 검색 기반 학습: 방대한 요리책 라이브러리에 접근할 수 있는 요리사를 상상해 보세요. 에이전트는 데이터 저장소에서 관련 예제와 지침을 동적으로 가져올 수 있습니다.

  3. 미세 조정: 이는 요리사를 요리 학교에 보내는 것과 같습니다. 특정 유형의 작업에 대한 체계적인 훈련을 통해 전반적인 성능을 향상시킵니다.

생산 준비된 에이전트 구축

백서의 가장 실용적인 부분은 생산 환경에서 에이전트를 구현하는 방법을 다룹니다. Google의 Vertex AI 플랫폼을 사용하여 개발자는 다음을 결합한 에이전트를 구축할 수 있습니다:

  • 사용자 상호작용을 위한 자연어 이해
  • 실제 행동을 위한 도구 통합
  • 맥락적 응답을 위한 메모리 관리
  • 모니터링 및 평가 시스템

에이전트 아키텍처의 미래

아마도 가장 흥미로운 것은 "에이전트 체이닝"의 개념입니다. 이는 복잡한 작업을 처리하기 위해 전문화된 에이전트를 결합하는 것입니다. 여행 계획 시스템을 상상해 보세요:

  • 항공편 예약 에이전트
  • 호텔 추천 에이전트
  • 지역 활동 계획 에이전트
  • 날씨 모니터링 에이전트

각각은 자신의 도메인에 특화되어 있지만, 함께 종합적인 솔루션을 만듭니다.

미래에 대한 의미

AI 에이전트의 출현은 인공지능의 근본적인 변화를 나타냅니다. 생각만 할 수 있는 시스템에서 실제 문제 해결에 적극적으로 참여할 수 있는 시스템으로의 전환입니다. 우리는 아직 초기 단계에 있지만, Google의 백서에 설명된 아키텍처와 접근 방식은 AI가 수동적인 도구에서 실제 문제 해결에 적극적으로 참여하는 방향으로 진화하는 명확한 로드맵을 제공합니다.

개발자, 비즈니스 리더, 기술 애호가에게 AI 에이전트를 이해하는 것은 단순히 트렌드를 따라가는 것이 아니라, AI가 인간의 노력에 진정한 협력 파트너가 되는 미래를 준비하는 것입니다.

AI 에이전트가 귀하의 산업을 어떻게 변화시킬 것으로 보십니까? 아래 댓글에 의견을 공유해 주세요.