회사가 클로드 엔터프라이즈로 이전했는데... (feat. 요금 폭탄)
처음에는 맥스(Max) 요금제를 사용하다가 회사에서 팀즈 프리미엄(Teams Premium)으로 변경해 주었는데, 두 요금제 간에는 큰 차이가 없었습니다. 많은 분들이 클로드(Claude) 코드를 요청하셔서 회사가 엔터프라이즈(Enterprise) 요금제로 전환했는데, 엔터프라이즈는 사용량 기반 과금 방식이라 제 계정에 125달러가 할당되었습니다. 평소처럼 정상적으로 사용했는데, 단 한 번의 세션에서 50달러가 소진되다니 정말 말도 안 되는 일입니다.
Max 플랜을 사용했을 때와 똑같이 사용했다면 제 사용량은 적어도 1,000달러에 육박했을 것 같습니다. Max 플랜 형태로 터무니없는 수준의 보조금이 제공되는 건가요? 도대체 이걸 유지할 수나 있을까요?
source reddit.com
방금 모두 Enterprise로 옮겼고 이제 하루에 $2.5k 쓰는 중임.
다들 이런 일이 생긴다고 경고받았는데도 패닉 순간임. 갑자기 프롬프트 튜닝이 엄청 중요해지는 중 :)프롬프트 튜닝해도 Opus 비용이 비싸서 단일 세션 사용량은 여전히 높음. 헤비 유저한테는 $125도 일주일 못 버틸 것 같음.
맞음, 우리 Team 계정이 거기서 한계에 걸렸음. Enterprise는 그냥 모두가 여기저기서 토큰을 태울 수 있게 해줌. 적응하면서 일부 제한을 만들고 있는 중임.
계속 Teams 플랜 한도에 걸리는 사람들한테 추가 사용량을 켤 수 없음? 그럼 해결되는 거 아님?
맞음, 우리가 그렇게 했음. 몇 명은 “pro 6.25x” 쓰고, 대부분은 standard 쓰고, pro까지는 필요 없지만 대부분 주에 standard 라이선스를 다 쓰는 사용자한테는 사용자별 추가 사용량 한도를 둠.
나는 직장에서 꽤 꾸준히 시간당 ~100씩 씀
$125면 대략 3-4시간 버틸 듯. 아마도
그리고 나는 세션당 2-3턴만 하는 미친 워크플로임. 어떤 사람들은 세션당 훨씬 더 많이 함.Opus를 계속 쓰는 이유가 있음?
표준 작업은 더 가벼운 모델로 바꿀 수 없는 거임?솔직히 max/teams premium에서는 한도에 자주 걸리지 않았음. 그래서 Opus 쓰는 데 익숙해졌음.
본업에서는 토큰당 과금임. 더 빠르게 하고 싶거나 정말 가벼운 사고/대량 데이터 작업이면 가벼운 모델을 씀.
“로그의 에러를 분석해, haiku 서브에이전트를 써.” 이런 용도의 커스텀 에이전트가 몇 개 있음. 가끔 모델이 알아서 그걸 쓰기도 함.
근데 그 이상은 토큰 최적화에 드는 정신적 부담과 사람 시간이 아깝지 않음.나는 비교적 라이트 유저인데… 같이 일하는 사람들에 비하면, 오늘 $100 태움
모델 선택할 때 사람들이 판단이라는 걸 하긴 함? 모든 것에 Opus가 필요한 건 아님. 나는 가능하면 Haiku도 씀.
max 플랜이면 대부분 다른 모델 신경 안 쓰고 Opus만 씀
Enterprise로 옮긴 이유가 있음? 대기업에는 필수 요건임?
SOC2, SSO, 프롬프트 라이브러리, 공유 프로젝트, ClaudeCode 쓰는 약 60명 때문임. Teams에서는 계속 사용량 한도에 걸렸음. 고통을 줄이려고 헤비 유저 일부를 Personal Max 플랜으로 옮길 수도 있음. 우리 헤비 유저들은 지금 한 달에 $1k씩 먹음.
헤비 유저 일부를 Personal Max 플랜으로 옮겨서 고통을 줄인다.
개인 플랜에서는 DPA를 못 받음. 그래서 기업 용도로는 자동 탈락임.맞음, ZDR은 Enterprise에만 있음. 그래도 이건 Max x5 같은 거지, API 쓰듯이 태우는 $125는 아니라고 봄.
60명에 2500이면 합리적임.
동의함. 결국 훨씬 더 많이 쓰게 될 거고, 그래도 합리적일 거라 봄.
그래도 몇몇 사람들한테는 가격 충격이 있음!초보 수준이네, 우리는 사용자당 월 8-15k 쓰는 사람들 있음 😭
이쯤 되면 이게 정말 가치가 있는지 궁금함. 그 돈이면 개발자 1-2명 고용 가능함. 그 사람들이 $20 cursor 구독으로 코드 완성만 써도 코드 품질과 이해도가 더 높고, 속도도 비슷하지 않을까 싶음.
teams 플랜에도 sso, JIT 프로비저닝, soc2, 공유 프로젝트가 있고 60명도 쉽게 지원함. standard나 premium 시트가 사용량 한도에 닿으면 api 과금으로 전환되는데, enterprise가 어떤 이점이었는지 잘 모르겠음.
나도 헤비 유저들한테 personal max 플랜 주자고 똑같이 요청했음. 우리 팀이 들어줬으면 좋겠음
그 시점이면 enterprise의 모든 보안 이점을 내다버리는 거임. 그렇게 할 거면 enterprise를 완전히 벗어나는 게 나음. 현재 상태에서 조직이 감당 못 하는 게 분명하고, 법적 책임도 신경 안 쓴다면 부분적으로 신경 쓰는 척할 필요 없음.
우리 조직은 감당 가능함. 다만 내가 그 정도 토큰을 태우는 게 편하지 않은 거임. claude code에 $1000씩 쓰는 건 별로임. 아마 그게 내 심리적 한계임. 그리고 요청해도 Enterprise 플랜의 추가 이점 때문에 아마 안 들어줄 거임.
언급한 ‘프롬프트 튜닝’에 관심 있음. 어떤 방식임? 더 자세히 설명해줄 수 있음, 어디서 더 알 수 있음? (토큰 절약용 프롬프트 재작성이나 이미 준 컨텍스트 재사용을 말한 것 같음.)
그냥 사용자들에게 ‘Claude는 검색 엔진이 아니니 google을 써라’ 또는 ‘Claude에게 크고 열린 질문을 하지 말고 구체적으로 해라’ 같은 걸 교육하는 것임. 교육으로 배포할 수 있는 수업 같은 것도 있음. 엔지니어들의 프롬프트도 리뷰해서 claudecode를 최대한 잘 쓰고 토큰 낭비를 줄이게 함.
토큰도 다른 것들과 같은 자원이고, 갑자기 관리 책임이 중요해진 것임.
enterprise 비용은 그냥 모노폴리 돈이거나 명목상 api 수수료고, 할인 패키지가 있는 줄 알았음. 아닌 거임?
약정 기반 할인 받음. 대략 2%. 직원 200명으로 Teams 한도에 닿아서 앞으로의 방향을 잡는 중임.
2%
ㅅㅂ 뭐임맞음, 나랑 CFO 반응도 그랬음. Anthropic은 네가 그 마약이 필요하다는 걸 알고 있음.
맞긴 한데, 실제로 생산성은 솔직히 어떻게 됐음?
많은 경우 미친 듯이 올라감. 경험 많은 사람일수록 향상이 훨씬 큼. 경험 적을수록 향상도 적음.
어떻게 측정했음
개발자 지표에서 보고 있고, Context와 Speed 두 가지 버킷으로 생각함.
주니어 개발자들은 엄청난 속도 향상은 못 보고, 그루밍 이후 범위 변경 감소, 회귀 수 감소, 정시 납품 증가로 측정되는 더 깊은 컨텍스트를 얻는 중임.
더 시니어한 사람들은 말도 안 되게 빠르게 납품 중임. 예: 3개월로 잡은 데이터베이스 마이그레이션이 1주일 걸림.grooming이 뭐임
개발자들이 요청받은 기능 작업을 세분화하는 과정임. 이건 컨텍스트가 많이 필요한 이벤트이고, 우리는 8년 된 코드베이스가 있으며 약 100명 정도의 개발자가 건드려 왔음. 컨텍스트가 미친 듯이 깊고 복잡함.
Claude 없이는 개발자들이 뭘 해야 하는지 파악하는 데만 상당한 시간을 씀. 그걸 하는 모든 영향까지 이해하는 건 말할 것도 없음.
Claude가 있으면 8년 전체 히스토리를 즉시 손끝에 두게 되고, LLM이 그 주제에 대해 전체 시스템 전반에서 지금까지 수행된 모든 작업의 맥락 안에서 해야 할 일을 이해하도록 도와줌. 의존성과 회귀 지점을 찾아줌. 우리가 존재하는지도 몰랐던 버그를 찾고, 생각하지 못했을 새 테스트 케이스를 만들도록 도와줄 수 있음.
이건 미친 수준의 속도 향상은 아닐 수 있지만, 깊은 컨텍스트를 만들고, 그래서 미래 버그를 줄이며, 전반적으로 더 견고한 산출물을 만듦. 그리고 결국 그런 개발자들이 Sr이 되면 속도 이득을 얻기 시작함.
우리 회사는 이번 달 이미 토큰에 30k USD 넘게 썼음. Claude 쓰는 개발자가 30명 넘으니 예상 밖은 아닐 듯. 아마 올해 연봉 조정이 안 된 이유가 이거인 듯.
더 많은 일과 산출물이 기대되는데, 임금은 같거나 줄어듦. 멋지네!
회사에서 사람들이 실제로 AI를 어디에 쓰는지 궁금함. 그냥 모두가 회사와 상관없는 자기 마음속 프로젝트를 바이브 코딩하는 건가 싶음. 아니면 회사 독점 데이터를 넣고 데이터 분석용으로 가끔 “analyze”만 치면서 바이브 코딩하는 건가.
최종 사용자 입장에서 매일 새 기능과 버그 수정을 기대하는데, 회사들이 AI로 코딩해서 의미 있는 게 나온 걸 본 적이 없음.여기서는 소프트웨어 엔지니어 얘기하는 것임. 우리는 AI를 이전에 하던 같은 작업 보조에 씀. 새 기능 구현, 유지보수, 리팩터링, 버그 수정. 나는 이걸 바이브 코딩이라고 부르진 않음. 적어도 AI를 유도하고 생성한 모든 코드를 리뷰하지 않고 PR 만드는 사람은 없다고 생각함.
우리는 파워 유저만 라이선스 줌. 나는 IT 배경이 있어서 꽤 빨리 적응할 수 있었던 것 같고, Claude Code 시작한 지 1개월 만에 첫 앱을 출시함. 진짜 포인트는 AI를 써서 회사 나머지 사람들이 사용할 앱을 만드는 것임. 앱에 API 키를 프로그래밍했음. 팀들은 실제 비즈니스 문제를 해결하는 일관된 서비스 제공을 받음. 평균 사용자는 그냥 아무 생 프롬프트나 넣고, AI가 평범한 결과를 내려고 엄청 열심히 일하게 만드는 느낌임.
Edit: 일주일 만에 그 앱이 이미 40+ 인시를 절약했고, 우리 5명짜리 팀 플랜은 1년치 비용을 쉽게 회수했음.
우리 회사는 반대로 갔음. 처음에는 Vertex로 Opus 과금했는데, 청구서가 ㅂㅅ같이 커져서 enterprise로 옮겼고, 리더십이 Vertex보다 관리가 쉽고 싸다며 모두에게 쓰라고 했음. 수백 명의 개발자가 탑승함. 지출 추세가 연 $1.8m로 가고 있었음. 재무가 2개월 차에 잘라냈고, 모두 GPT Enterprise나 Max 구독으로 옮겨야 했음. 그다음 GPT가 enterprise 과금 문제를 고쳤고, 첫 실제 청구서를 받았는데 이제 그것도 사용량 제한이 심해짐.
개인적으로는 ccusage 기준으로 Max x5에서 월 $2k 정도 토큰을 뽑아내고 있고, 내게는 대략 맞음. 다만 나는 하루 종일 코드에 깊게 들어가 있는 개발자는 아님.GPT enterprise도 사용량 기반임? 그리고 맞음, max/teams premium이 말이 됨. 앞으로 Anthropic이 더 큰 팀에는 enterprise를 강제할 수도 있음.
Codex는 그럼. chat은 마지막으로 봤을 때 월 $60 정도에 무제한인 것 같았음.
우리는 vertex로 과금함. 10명짜리 작은 회사지만 모든 걸 GCP에 호스팅해서 꽤 괜찮은 sustained use discount를 받음. 개발자 한 명이 나갔고 대체 채용 안 했는데 AI 지출이 그 사람 급여의 약 60%임. 모두가 최소 2x는 되고, 상위 엔지니어 일부는 3x라고 봄.
우리도 똑같은 일 있었음. 처음에는 1개월에 1인당 $250을 배정했음.
모두가 불평하기 시작함.
이제 $2000으로 올림.내 친절한 지배자들이 내 $20 Claude code enterprise 한도를 .... $100으로 올려줌
나는 github copilot infinite requests 해킹으로 날아다니고 있었는데 이제 이거임
haiku로 한 번에 1개씩 하면 2주치임‘infinite requests’가 어떻게 작동함?
Copilot은 사용량 기반 과금을 쓰지 않고(6월 1일까지), 대신 “premium request” 모델을 씀. 채팅 메시지 하나가 1 request로 계산됨. 더 큰 모델은 배율을 씀. 예: Opus 4.7은 15x 배율임.
하지만 메인 스레드에서 생성된 서브에이전트는 여전히 그 초기 premium request의 일부로 간주됨. Tool call과 응답도 추가 premium request 비용이 들지 않음. 즉 하루 종일 지속되는 1-2개의 장시간 세션을 돌리고, 계속 서브에이전트를 띄우고, ask_user 도구로 입력/결정을 요청하게 해도 하루에 premium request 몇 개만 드는 것임.
예를 들어 나는 Opus 4.6 high를 매일 하루 종일 컨텍스트 많은 세션에서 썼고, 월 허용량의 하루 1-2% 정도만 썼음.
하지만 6월 1일에 사용량 기반 과금으로 옮기고 있고, 사람들이 계속 지금처럼 쓰면 사용량이 “얼마였을지” 가정 청구서를 보내고 있음. 우리 회사 청구서는 지금 방식대로 계속 쓰면 6x가 될 것임.
나는 회사 enterprise 플랜에서 주당 약 $600-700 씀. 우리 회사는 토큰에 한 달 약 백만 달러를 쓰고 있음.
네 말은 회사가… 한 달에 그만큼 쓰고 있었다는 거겠지. 주주가 좋아하지 않음.
있었다고? 아직도 그럼. 방금 숫자 확인했는데 지난 7일 $258k, 지난 30일 $1.05m임.
내 프로젝트 하나는 계산해보니 몇 달 동안 월 ~$5000를 태우고 있었음. 매주 사용량 한도를 정기적으로 꽉 채웠고, 두 번째 MAX20 구독까지 해야 했음. 지금은 초점이 바뀌고 메인 프로젝트가 90%+ 완료돼서 월 몇백 달러 근처일 가능성이 큼.
헬스장 멤버십 같은 거라고 봄. 90%는 거의 안 쓰고 나머지를 보조해줌.그러길 바람. 나는 최근 Cursor Ultra($200 / mo)에서 Claude Code Max($100 / mo)로 바꿨음. Cursor에서는 2주 안에 API 사용량 한도에 닿았음. CC에서는 한도에 근접한 적이 없음. 그리고 모든 것에 Opus 쓰는 중임.
이게 오래가진 않을 거란 건 알지만, 여기서 벗어나 적응하기는 힘들 것임.
시트에 붙는 연간 수수료도 잊지 마셈.
나는 직장에서 enterprise 쓰고, 개인 프로젝트용으로 Claude Max 20x도 쓰는데, 사용량은 enterprise 토큰 기준 $1000/mo와 비슷하다고 봄.
이해 안 되는 건 왜 무한히 싼 대안으로 안 가느냐임. claude enterprise는 너무 비쌈.
가격은 다 개소리임. 실제 운영 비용이 얼마인지 아무도 모름. composer 2.5 성능이랑 비교해보셈...
이번 주에 업계 선도 CISO들이 발표와 토크를 하는 IT 컨퍼런스에 갔음. 큰 주제 중 하나가 비즈니스에서 AI의 ROI였음. 솔직히 개소리투성이였음. 마지막 질문 시간에 그 위치에 있는 사람들이 AI의 실제 비용과 장기적 실행 가능성을 어떻게 다룰 계획인지 물었음. 특히 AI가 벤처 캐피털과 “pre profit”으로 얼마나 크게 보조되고 있는지 때문임. 이 정확한 게시물이 미래 비용이고, 이것조차 아직 수익보다 낮을 수 있음. 기업들이 팀용 max 플랜으로 시작하거나 사용하고 있음. AI를 핵심 백본 프로세서처럼 박아 넣어서 AI에 크게 의존하는 도구를 개발하고 있음. 결국 투자자들은 수익을 보기 원할 것임. 그러면 A, ai 회사가 무너지고 너희가 망함. 또는 B, 비용이 터무니없이 높아지고 너희 비즈니스가 무너짐. 현실은 AI 사용 비용이 현재 지불하는 것의 10-40x라는 것임.
과거에 인간을 쓸모없게 만들거나 프로세스를 훨씬 빠르게 만든 다른 자동화 및 유사하게 영향받은 분야의 역사를 바탕으로 추측하자면, AI 회사들은 AI가 인간의 삶과 일에 너무 근본적인 것이 돼서 기업과 사용자가 가격이 얼마든 그냥 지불할 거라고 베팅하는 것 같음. 그게 없으면 경쟁을 따라갈 수 없어서 실패할 수밖에 없거나, 도구 자체가 그 없이는 아예 작동하지 않기 때문임. 그리고 시장을 완전히 쥐고 있으면 원하는 대로 할 수 있음. 기본적으로 마지막까지 살아남아 가격을 정할 수 있는 AI 도박임.
Edit: 말하는 걸 깜빡했는데, 그들은 그 질문에 어떻게 답해야 할지 ㅈ도 몰랐고 생각해본 적도 없었음. 자기가 뭘 하는지도 잘 모르는 사람들의 전형적인 희망과 기도임. 나머지는 그냥 이 문제에 대한 내 생각임. 1년 더 봄. 일이 정말 나빠지기 전까지 어쩌면 2년.Enterprise로 옮기는 이점이 뭐임? 우리 회사는 현재 teams인데 많은 사람이 접근 권한을 요청하고 있어서 enterprise로 옮겨야 할 수도 있다고 생각 중임...
SOC2, SSo, 공유 프로젝트, 프롬프트 라이브러리 같은 것들임. Teams는 정말 빨리 한계에 닿음.
단순 과금. HR의 Claudia가 Harry Potter 팬픽 쓰느라 90k어치 토큰 태우지 않길 바라는 것.
Teams 플랜의 크기 제한(시트 수)에 걸려서 Enterprise로 가게 됐음.
플랜 한도 때문에 불평하고 징징대는 사람들은 실제로 자기가 쓰는 만큼 돈을 내는 삶이 어떤지 전혀 모름.
내가 이상한 건 우리가 같은 이야기를 계속 본다는 점임. 계약서에 서명하는 사람들이 비용을 모른다는 건 완전히 멍청한 일임.
많은 회사들이 크게 얻어맞기 전까지는 별로 신경 안 쓰는 것 같음. 그리고 claude도 거대한 enterprise 플랜을 보조할 수는 없을 듯. 개발자로서 나는 우리 팀에 나를 teams premium이나 max plan으로 다시 옮겨달라고 확인 중임.
프롬프트마다 몇 토큰이 필요할지 알 수 있어서 비용 판단도 어려움.
여기서도 똑같이 했음. 나는 2일 만에 내 Max 플랜으로 돌아갔음.
내 CC statusline에는 tokens x api pricing 카운터가 있는데, 지난 30일 동안 API 가격으로 냈으면 14776$였을 거라고 나옴 XD 다행히 나는 claude max x20인데, 맞음, API로 이걸 내야 하면 지속 불가능함.
캐시 할인을 반영 안 한 것 같음. 아마 실제론 5천 달러쯤일 듯.
Anthropic은 현재 일종의 가격 테스트를 하는 중임. 가치 있는 목표에 그런 비용을 태울 만한 경우에만 어떤 토큰 패키지든 감당할 수 있는 사용자층을 보게 될 것 같음. 진짜 문제는 현재 가격으로 토큰을 쓰는 비즈니스 모델이 어떤 비용 계산에서든 토큰당 가격 상승을 예상하지 못할 수 있다는 점임. (우리도 여러 번 겪음. 예: Oauth -> TOS exclusion, 계정 확장 “제안”이지만 API 사용량 추가 과금 유지)
opus 4.6은 대형 컨텍스트에서 모델이 나빠지지 않는다면 괜찮음. 하지만 많은 개발자나 소프트웨어 회사들은 내가 말한 가치 있는 목표를 갖고 있지 않음. 나는 개발자도 아니고 코딩도 못 하지만, 나만의 ‘가치 있는 사용 사례’는 있음.
곧 중국 모델 쪽으로 큰 이동이 있을 것 같음. 대부분의 사람들이 OpenAI나 Anthropic의 증가하는 토큰 비용을 감당하지 못하게 되는 순간부터.비용 계산 도구를 쓰면 내 $200 max 플랜이 월 $20k 넘는 API 토큰에 해당한다고 주장함.
파티가 끝날 때까지 즐기셈.
피크 사용 시간 토큰을 아끼려고 밤새 배칭하기 시작할 때까지 기다려보셈, lol
밤새 어떻게 바이브 코딩을 함? 여기서 batching이 무슨 뜻인지 모르겠음.
ㅈㄴ 끔찍함. 우리 팀은 처음에 월 사용 한도 $100으로 시작했고 나는 “....진심임?” 이랬음. 이 현실이 곧 사람들에게 아주 세게 닥칠 것임.
나도 같은 글을 올리고 싶었음. 개인 $20 플랜이 있고 직장에서는 월 $30가 있음. 사용량 한도에 대한 불평이 웃긴 게, 우리는 아직 공짜 물결을 타고 있고 결국 그게 육지에 부딪혀 깨질 것임.
추측하자면 Claude(또는 ChatGPT나 다른 프론티어 임대료 추구자들)에 깊게 들어가는 회사의 90%는 실제로 Claude가 필요하지 않음. 대신 enterprise OpenRouter를 세팅하고, 기본적으로 훨씬 싼 모델로 라우팅해도 아무것도 놓치지 않을 가능성이 큼. 비즈니스 세계에 “프론티어의 최신·최고 모델이 모두에게 절대 필요하고, 그래서 터무니없이 부풀린 가격을 내야 한다”고 설득하는 건 거의 역사상 최고의 마케팅 사기에 가까워지고 있음.
그럴 수도 있지만, 어느 정도 민감한 데이터를 다루고 DPA나 데이터 레지던시가 필요한 사람에게는 선택지가 심하게 제한됨. 내 개인 데이터라면 중국으로 가서 학습에 쓰이든 신경 안 씀. 내가 일하는 회사의 고객 데이터라면 절대 출발점조차 안 됨.
중국 모델과 기업 사용은 같이 가지 않음.
모델은 말 그대로 숫자일 뿐임. 마법은 추론 중에 일어나고, 그건 어디서든, 어떤 엔진에서든, 어떤 커널로든 일어날 수 있음. OpenRouter에는 모든 오픈 웨이트 중국 모델에 대해 ZDR provider 옵션이 있음. 네가 RTX 6000 PRO에서 Qwen을 돌리는데 데이터를 중국으로 보내는 “마법의 트로이목마” 같은 건 없음.
악성 동작이나 백도어를 학습시킬 가능성은 있음. 예를 들어 bash 도구 사용과 curl 명령을 트리거하는 토큰 시퀀스가 있을 수 있음. 관련 기법을 다루는 논문: https://arxiv.org/abs/2401.05566
bash 도구 사용과 curl 명령을 트리거하는 토큰 시퀀스가 있을 수 있음.
애초에 그 “토큰 시퀀스”가 들어가려면 검증 안 된 신뢰할 수 없는 입력을 모델에 먹이고, 거기에 출력도 모니터링하지 않는 상황이어야 함. 모든 bash 명령은 감사 가능하고 눈에 띄며, 어딘가로 curl하려는 순간 바로 알 수 있음. 그런 상황이면 네 데이터에 무슨 일이 생겨도 당해도 쌈.웹 도구가 있는 모든 에이전트는 신뢰할 수 없는 데이터를 가짐. 즉 모든 코드 에이전트가 그럼. 그리고 네 허가가 필요한 bash 도구를 호출할 필요도 없음. 코드베이스에 작은 변경을 만들어 백도어를 넣을 수도 있음. “나는 모든 코드를 리뷰한다”는 답이 올 거라 예상함. 네가 그렇다면 좋지만 많은 사람들은 안 그럼.
개인적으로 Claude Code가 enterprise 수준에서 진짜 지속 가능하다고 생각하지 않음. 어떤 회사도 비용을 모르는 물자를 사지 않음. 투입 비용이 얼마일지 모르면 어떤 회사가 재무를 관리할 수 있음?!
그래서 예산이 존재하는 것임. 기업에는 변동 비용이 많음. 그렇다고 기업이 그런 일을 안 하는 건 아님.
맞지만 대부분의 비용은 분기 단위로 보면 Anthropic이 갑자기 “응 참고로 다음 달부터 추론 비용은 지금의 세 배야 ㅅㄱ” 하는 것보다 훨씬 예측 가능함.
맞음, 보통 이런 계약은 가격의 큰 변동을 막아주지만, 새 모델은 5x가 될 수 있음(안녕 Mythos). 그래도 다시 말하지만 여기에는 예산 통제가 있을 것임.
보통은 특정 결과에 대해 예산을 잡음. Anthropic 비용은 그 점에서 불투명함. 감당 가능한 가격으로 원하는 소프트웨어를 실제로 납품해줄까? 예산을 고정했는데 산출물이 준비되기 전에 다 써버릴 수도 있음. 다른 누구와도 이런 리스크를 열어둔 채 계약서에 서명하지 않음.
소프트웨어 비즈니스 처음임?
아니 친구, 25년 넘게 해왔음. 대부분 소프트웨어 비용 관리는 들어가는 사람의 노력에 관한 것이었음. AI라면 같은 결과물을 내는 인간 노력보다 더 싸게 할 수 있어야 한다고 기대할 것임. 그런데 점점 더 많은 회사들이 AI가 더 비싸다는 걸 알아가는 중임!!
내 5x 플랜에서 이번 달 Claude Code만 $2000 썼고, Claude chat 사용량도 있음. 그건 아마 많지는 않을 듯.
Claude가 토큰과 비용을 status bar에 표시하는 작은 위젯을 만들게 했음. 정확하진 않겠지만 정기적으로 하루에 “$60-$100” 씀.
이것이 Anthropic이 보조금 들어간 플랜 사용자들을 없애려는 바로 그 이유임.
맞음, Anthropic에서 추가 사용량 크레딧을 받아서 켰을 때 단일 프롬프트에 $27 썼음. 다음번에 받은 것($200)은 하루 만에 사라짐. Colossus에 올라간 뒤 플랜 한도를 올려서 지금은 훨씬 더 극단적임.
하지만 그걸 보면 구독에서 얼마나 많이 주는지 알 수 있는데도 사용량 불평은 매일 ㅈㄴ 계속됨...
왜 구독 플랜이 보조금을 받는다고 가정함? API 플랜이 훨씬 더 수익성이 높은 게 아니라?
참고로 Anthropic은 구독 플랜을 좋아한다고 말함. 사용자가 뭘 하는지 더 잘 이해하는 데 도움이 되기 때문임. 일부 사용자가 사용량을 꽉 채워 한도를 밀어붙이는 건 확실하지만, max 플랜 서비스도 여전히 수익성이 있을 거라고 의심함. 물론 무료 플랜은 보조금이지만, 그걸 쓰는 사람들은 결국 유료 고객이 되거나, 아니면 애초에 많이 과금할 만큼 가치 있는 일을 하지 않는 사람들임. 지금은 고객 유입 경로로 그걸 유지하는 게 말이 됨. 결국 훨씬 낮은 한도나 체험 플랜이 생길 가능성이 큼.단일 세션 하나가 50$를 태우고, Max 플랜의 5시간 한도로 쉽게 커버됨. enterprise라도 대기업들이 이런 높은 가격을 낼 준비가 되어 있다는 건 나한테는 미친 소리처럼 들림. API 플랜이 수익성 있을 수도 있지만, 실적 보고서를 보기 전에는 확실히 모름. 지금은 VC 돈으로 굴러가고 있고, Anthropic은 내년 말쯤 수익성을 기대하는 것 같아서 그렇게 높은 수익성은 아니라고 봄.
같은 산출물을 인간이 만드는 것과 비교하면, 비용은 사실 극히 작음.
맞음, 최근 내 사용량을 분석해봤음. 알고 보니 Max 플랜에서 지난 6개월 동안 $3000어치 Claude를 썼음. 휴가도 몇 번 갔고, 업무용 Claude 계정은 따로 있음. 구독은 크게 보조되고 있음.
그렇긴 해도 사용량을 최적화할 기회가 많다고 봄.
기본적으로 Claude는 컨텍스트를 얻으려고 repo의 모든 파일을 읽음. 나는 이제 Claude가 전체 repo를 읽기 전에 repo의 codemap 구조를 먼저 읽는 워크플로를 만들었음. 이 덕분에 더 관련 있는 컨텍스트를 가지게 되어 Claude가 기능을 만드는 데 필요한 턴 수가 본질적으로 줄었음. 동시에 input tokens + cache reads도 크게 줄었음. 전체 repo를 로딩하는 건 컨텍스트를 썩게 만들기 때문임.내가 할 수 있는 최선은 토큰 절약을 돕는 것임. 대부분은 Claude가 토큰을 낭비하게 두고 있고, 때로는 50%까지 낭비함. https://analyzer.spec-kitty.ai/
무료 도구임. 안전하게 사용 가능함. 개인화된 리포트와 각 개발자가 최대 절약을 하도록 생성된 플러그인을 제공함.
천만에 =)맞음, 지속 가능함.
사용량을 API 토큰/비용으로 보여주는 nodejs 패키지가 있음.
npx ccusage@latest
https://github.com/ryoppippi/ccusage너 방금 논리와 경제학을 바이브로 썼네, 축하함.
@everyone 다 터지기 전에 Tokenmaxxx 하셈!
우리 회사에서는 Enterprise로 간 뒤 아무도 Opus를 안 씀. 하루에 쉽게 $50-100씩 예산을 먹어치움. 그래서 이제 모두 Sonnet으로 타협해서 $200/month 예산을 지키는 중임. 말할 것도 없이 우리는 Opus를 다시 쓰려고 더 큰 예산을 얻기 위해 세게 싸우는 중임. 근데 맞음, API 가격은 꽤 미쳤음.
음, 나는 하루에 토큰 약 $2K 정도 쓰는 중임(다층 에이전트 구성). 솔직히 6월 15일 이후에 뭘 해야 할지 전혀 모르겠음 😅
개인 플랜이 크게 보조된다고 생각함. 개인 플랜이 하이프 사이클을 만들고, 그게 조직 구매로 이어지며, 조직 구매는 매우 수익성 있어 보이기 때문임.
나는 실제로 API 가격에 대한 임시방편 솔루션을 만들고 있음. 너와 제공자 사이에 놓이는 라우터임(API 요청에 추가 마진 없음). 독특한 의미론적 캐싱과 중복 제거 시스템, 그리고 다른 규칙 기반 라우팅(사용자/팀 설정 가능)을 구현했음. 지금까지 내 API 비용은 급격히 감소했음.
**헤비 유저/팀 세션에서 캐시 히트를 제공자에 도달하기 전에 내부에서 처리할 수 있고, 캐시 주입을 활용해 캐시 미스를 최소화할 수 있는 경우.나는 이걸 버블 붕괴로 봄.
API 사용량 기반이면 차라리 cursor 쓰는 게 나음. 적어도 여러 제공자의 모델을 전환할 수 있음. 클라우드 env 기능도 좋음.
사람들은 cursor에 moat가 없다고 하는데, 나는 동의 안 함. moat는 하나의 제공자로 여러 모델을 쓰고, 충분히 괜찮은 자체 저가 모델이 있다는 점임.아님!
잠깐... 너희 회사들은 개발자 AI 비용을 내줌?
회사가 AI 사용 비용을 낸다고?? 뭐가 그렇게 놀라움?
시트 기반 가격은 오래 못 감. 가능할 때 즐기셈.
토큰은 우리가 정한 가치만큼만 가치 있음. 살아남기는 할 거라 확신함.
생존의 문제가 아님. 그들은 방법을 찾을 것임. 하지만 우리는 이 높은 사용량에 익숙해졌고, 앞으로 줄어들까 봐 걱정됨. 지금 사람들은 chatgpt로 옮기고 있지만 사용자 기반이 자리 잡으면 거기도 사용량을 줄일 거라고 확신함. 파티는 언젠가 멈춰야 함.
모든 것에 Opus 쓰지 마셈. Sonnet/Haiku에 더 의존하셈. 습관을 정리하셈. 새 작업이나 관련 없는 항목에는 새 세션을 쓰셈.
우리 헤비 유저들은 $500/mo 범위임. 어떤 회사들은 엔지니어당 월 네다섯 자리 지출을 허용하고 있음.이거임. 토큰 사용량에 불평하는 모두가 게으른 것임. 불필요한 컨텍스트를 넣고, 작업마다 새로 시작하지 않고, skills를 최적화하지 않고, 작업에 따라 모델을 선택하지 않음. opus 4.7이 기본값이면 안 됨.
맞음, Enterprise 플랜은 빠르게 높은 최소 비용에 묶일 수 있음. Enterprise 오버헤드 없이 Claude와 다른 모델에 더 싸게 접근하려는 것뿐이면, Frugal Relay가 여러 제공자로 라우팅해주고 공식 API 가격의 약 10% 수준임. 같은 API를 쓰면서도 비용을 예측 가능하게 유지하는 간단한 방법임.
우리 회사는 토큰에 한 달 수십억을 쓰고 있음. 미쳤음. 하드웨어와 물리 인프라까지 포함하면 올해 약 $175B가 될 것 같음. Claude가 얼마나 차지하는지는 모르겠음.
그냥 deepseek v4 쓰셈. 비용은 극히 일부임. 너희는 실제 개발자 없냐? 진짜 개발자라면 하위 모델도 올바른 방향으로 유도해서 생산성을 높일 줄 알아야지, opus 4.7 같은 최상위 모델에 100% 의존하는 작은 바이브 코더처럼 굴면 안 됨.
opus 대신 sonnet을 써도 됨. 토큰 면에서 훨씬 가벼움.
토큰 사용량 줄이려고 rtk, Claude mem, caveman 같은 것도 안 씀?
중요한 건 token maxing이 아니라 토큰 효율임.맞음, 서구권 회사가 중국 회사를 쓰게 만드는 데 행운을 빎. 컴플라이언스 악몽임.
나는 태우고 싶은 만큼 토큰 태울 거임.
댓글을 남기려면 로그인이 필요합니다.
로그인 후 이 페이지로 돌아와 바로 댓글을 남길 수 있습니다.
