개아범 on x

Claude Code로 퇴근 후 사이드 프로젝트 만지다 보면 꼭 막히는 순간이 생김. 새 라이브러리 도입하려고 '요즘 A랑 B 중에 뭐가 낫냐' 물어보면 걔 모름. 학습 데이터 끊긴 이후 건 모르고, 억지로 답 시키면 없는 거 지어내줌. 모른다고 하면 그나마 낫고, 자신 있게 틀린 정보 알려주는 게 제일 문제임. 이거 몇 번 당하면 리서치는 직접 해야겠다 싶어지는데, 퇴근 후 체력으로 탭 수십 개 열어가며 하기엔 솔직히 빡셈.

GPT Researcher라는 오픈소스 도구가 있음. GitHub 별이 27,983개 달린 프로젝트고, 어떤 주제든 자율 에이전트가 여러 웹소스를 병렬로 뒤져서 인용 포함한 상세 리서치 보고서를 자동으로 생성해주는 구조임.

이 도구가 노리는 문제가 명확해서 처음 봤을 때 눈에 들어왔는데 — LLM 기반 리서치의 구조적 한계 세 가지를 다 건드린다. 첫째, 최신 정보 못 다루는 문제. LLM은 학습 시점 이후는 그냥 모름. 어떤 모델이든 이건 피할 수 없는 한계인데, 이 도구는 웹에서 직접 끌어옴. 둘째, 할루시네이션. 출처 명시된 보고서를 뽑아주니까 검증이 가능해짐. 셋째, 긴 보고서 생성할 때 토큰 한계. 병렬 에이전트로 분산 처리해서 이걸 우회함.

Claude랑 붙이는 방향은 두 가지인데, README에 Claude Skill로 설치하는 방법이 직접 나와있음. 그러면 Claude가 딥 리서치 요청받을 때 이 에이전트를 끌어다 쓰는 구조가 됨. 이 도구 자체가 여러 LLM 프로바이더를 지원하니까 반대로 백엔드를 Claude로 설정하는 것도 가능하고. 어느 방향이든 연결이 된다는 게 포인트임.

실제 활용하면 이런 흐름이 나오더라. 주말에 새 기술 스택 평가해야 할 때 — '이 프레임워크 커뮤니티 반응이 어떤지', '최근 깃허브 이슈에 뭐가 쌓였는지' 같은 걸 직접 탭 열고 뒤지면 코딩보다 이게 더 피곤할 때 있거든. GPT Researcher한테 던져두고 그 시간에 실제 코드 만지면 작업 흐름이 끊기지 않아서 좋더라.

Plan-and-Solve랑 RAG 기반으로 설계됐다고 나와있는데, 막상 보고서 받아보면 구조가 그냥 텍스트 뭉치가 아니라 논리적으로 정리돼서 나옴. 인용 포함이라는 게 'AI 리서치 결과 믿어도 돼?' 의심을 출처로 해결해주는 거라 — 막상 쓰면 심리적 안정감이 다름. 결과 그냥 복붙이 아니라 출처 직접 눌러보고 확인이 되니까. pip, Docker, 로컬 전부 지원함.

이런 거 볼 때마다 드는 생각인데 — Claude나 어떤 모델이든 기본 웹검색을 진짜 잘 해줬으면 이런 거 따로 붙일 필요 없잖아. 당장 현실은 그렇지 않으니까 이런 조합이 지금 시점에선 맞는 것 같기도 하고. 근데 1~2년 후에 이 도구 얼마나 살아남을지 모르겠긴 함. 어쨌든 별 27,983개면 그냥 실험 프로젝트는 아님. 관심 있으면 한 번 설치해보는 거 나쁘지 않아 보임.

출처: GitHub — assafelovic/gpt-researcher