X 펭 펭귄 11h ago · archived 3h ago 회사에서 AX 전환으로 AI 3종 세트를 개방해줌 써보니까 바이브코딩 퍼포먼스는 Claude > GPT > Gemini 순으로 좋음 좋다는 말은 해줘만 해도 지가 코딩해서 어떻게 할지 말귀를 잘 알아먹음 지금 개방 2주만에 AX 경진대회가 열려서 효율화 방법 내놓으라고 난리임 회사에서 바이브 코딩 하니까 2일만에 한달치 토큰 다 써버림 얼마후 토큰 안쓴 사람 리스트 취합해서 부서에 돌아다님. 토큰 써야되니 네이버 물어볼껄 제미니한테 다들 물어보는중. 경진대회에서는 바이브 코딩 출품작들이 난립중. 나도 냈음ㅋㅋ 고생했다고 월욜 파트장님이 삼겹살 사줌. 이렇게 중구난방이 지나면 강한자만 살아 남을듯. 그리고 이렇게 막 만들면 진짜 업무 효율화가 되는게 의문임. $PLTR 쓰는 부서 있다고 들었는데. 차라리 그게 더 깔끔한게 아닐까 생각듬. 생각보다 바이브 코딩 개쉽다. 문제는 돈이다. 펭귄 $NVDA $AVGO ㅣ260701 AI 반도체 쏠림, 추론으로 무게중심 이동 1. 이미지 속 첫 번째 차트 보면 AI 가속기 매출이 2022년 200억 달러대에서 2026년 예상치 2000억 달러까지 5년 만에 10배 가까이 뜀. 이 거대한 증가분의 거의 전부가 한 가지 색, 즉 $NVDA 한 회사의 매출로 채워져 있음. 이쯤 되면 자연스럽게 떠오르는 질문 하나 있음 — 이 정도 쏠림이 앞으로도 그대로 유지될 수 있는가. 2. 결론부터 말하면 점유율과 매출 규모는 서로 다른 길을 가고 있음. $NVDA의 데이터센터 매출 점유율은 2024년 87%대까지 올라갔다가 2026년에는 75% 수준으로 내려올 것으로 전망됨, 그런데도 절대 매출액 자체는 오히려 더 커지는 역설이 벌어지는 중임. 시장이라는 파이 자체가 매년 거의 두 배씩 불어나니까 점유율이 줄어도 먹는 양은 더 많아지는 구조임. 그렇다면 점유율은 왜 줄어드는가로 자연스럽게 넘어감. 3. $AMD의 Instinct 라인이 두 번째 공급처로 자리 잡았고 더 중요한 건 구글 TPU, $AMZN 트레이니움, $MSFT 마이아, $META MTIA 같은 하이퍼스케일러 자체 설계 칩들임. 출하량 기준으로는 커스텀 ASIC가 연 44.6% 늘어나는 반면 범용 GPU는 16.1% 증가에 그치는 것으로 집계됨. 하이퍼스케일러들이 굳이 자기 손으로 칩까지 설계하는 이유는 단순함 — 공급을 통제하고 원가를 낮추려는 절박함 때문임. 그렇다면 이게 $NVDA에 실질적인 위협으로 작동하고 있는가로 이어짐. 4. 실상은 위협이라기보다 보완에 가까움. 외부 고객이 학습용으로 칩을 쓸 때는 여전히 CUDA 생태계를 떠나기 어려워서 $NVDA를 택하고, 커스텀 ASIC는 주로 하이퍼스케일러 자신의 내부 워크로드를 처리하는 용도로 쓰임. 그런데 진짜 구조적 변화는 첫 번째 차트가 아니라 두 번째 차트에 숨어 있음. 5. 두 번째 차트는 AI 컴퓨팅에서 학습과 추론이 차지하는 비중을 보여줌. 2022년에는 학습 비중이 80%대 중반으로 압도적이었는데, 2025~2026년 즈음 두 선이 50% 근처에서 교차하고, 2030년이 되면 추론이 60%대, 학습이 40%대로 완전히 역전됨. 왜 이런 역전이 일어나는지가 다음 질문임. 6. 학습은 모델 하나를 만들 때 한 번 들어가는 자본 지출이고, 추론은 그 모델을 쓸 때마다 발생하는 반복 비용임. 모델 종류가 늘고 사용자가 늘수록 추론 호출 횟수는 산술적으로가 아니라 기하급수적으로 쌓임. 같은 차트의 빨간 선, 하루 토큰 처리량이 로그 스케일임에도 거의 수직으로 꺾여 올라가는 이유가 바로 이것임. 7. 이 기하급수 증가를 더 가속하는 게 에이전틱 AI임. 에이전트가 처리하는 작업 하나는 단순 챗봇 대화보다 5배에서 30배 많은 토큰을 소모하는 것으로 분석됨 작업 하나가 여러 단계의 추론과 도구 호출, 재시도로 쪼개지기 때문임. 그렇다면 이 흐름이 반도체 투자 지형을 어떻게 바꾸고 있는지로 넘어감. 8. 자본이 학습 전용 인프라에서 추론 최적화 인프라 쪽으로 이동하는 중임. $AVGO 같은 ASIC 설계 협력사 매출이 빠르게 늘고 있고, $NVDA도 추론에 특화된 제품 라인을 강화하며 양쪽을 동시에 잡으려 하고 있음. 결국 승자독식이 아니라 시장 자체가 커지면서 여러 승자가 동시에 존재하는 구조로 흘러가는 모습임. 다만 거꾸로 보면 이 그림에 마냥 낙관할 수만은 없는 부분도 있음. 9. 가격이 떨어질수록 사용량이 더 크게 늘어나는 현상 때문에 토큰 단가 하락에도 불구하고 전체 지출은 계속 늘어나는 역설이 벌어지는 중임. 일부 분석에서는 지금 수준의 인프라 투자가 손익을 맞추려면 AI 업계 전체가 연간 수천억 달러 규모의 매출을 꾸준히 만들어내야 한다는 경고도 나오는 상황임. 그렇다면 1번에서 던졌던 질문, 이 쏠림이 계속될 수 있는가에 대한 답을 정리할 차례임. 10. 답은 절반은 맞고 절반은 틀림. $NVDA 중심의 점유율 쏠림은 분명 완화되는 방향으로 가지만, 전체 시장이 워낙 빠르게 커지고 있어서 절대적인 영향력은 당분간 유지될 가능성이 큼. 다만 진짜 승부처는 더 이상 학습 칩 경쟁이 아니라 추론 인프라를 누가 더 싸고 효율적으로 돌리느냐로 옮겨가고 있음. 결국 쏠림이 끝나는 게 아니라, 쏠림의 무게중심이 학습에서 추론으로 이동하고 있는 것뿐임. 7 1