AI 에이전트 만들면서 찾은 무료 API 꿀팁 방출. 🚀
투자 분석 에이전트 만들고 있는데 로컬에서 Ollama(Qwen 2.5 32B) 돌리니 요약 하나에 10초 걸리더라고. 근데 Groq API 붙이니까 Llama 3.3 70B가 0.6초 만에 끝냄. 모델은 2배 큰데 속도는 17배 빠르고 심지어 무료임.
에이전트 만들 때 유료 결제하기 전에 이거부터 써봐.
✅ Groq: LLM 요약/분석 (일 14,400건, 광속)
✅ Finnhub: 미주 뉴스/실적/내부자 (일 60건)
✅ Serper: 구글 검색 API (월 2,500건)
✅ FRED: 미국 거시 지표 (무제한)
✅ yfinance: 주가 데이터 5년치 (무제한)
✅ Ollama: 로컬 LLM (API 한도 초과 시 백업용)
핵심은 '자동 Fallback' 전략이야.
무료 API는 한도 초과가 제일 문제잖아? 이때 코드 3줄만 짜두면 Groq 한도 넘었을 때 로컬 Ollama가 바로 이어받게 할 수 있어.
1️⃣ 평소엔 Groq로 초고속 처리
2️⃣ 한도 걸리면 로컬 Ollama로 자동 전환
3️⃣ 무료 에이전트 완성…
Groq은 자체 칩(LPU)으로 오픈소스 모델을 초고속으로 돌려주는 API 서비스예요.
무료 사용법:
console.groq.com 가입 (구글 계정 1분)
API 키 발급 (무료)
Llama 3.3 70B, Qwen 32B 등 사용 가능
무료 tier로 분당 30회, 일 14,400회 호출 가능해서 개인 프로젝트에는 충분합니다. 저는 뉴스/리포트 요약에 쓰는데 응답이 0.6초 정도로 빨라요. Apr 20