Sự bùng nổ của công ty 149 thành viên
Chuyện gói AI rẻ hơn API tới 70 lần — và vì sao con số ấy có thể thay đổi cách các công ty lớn lên trong mười năm tới.
Mấy gói Claude hay ChatGPT 200 đô một tháng thực ra đang được bán lỗ cho người dùng nặng — y hệt một tấm thẻ gym. Hệ quả bất ngờ là có một lằn ranh nằm ở mốc khoảng 150 nhân viên: dưới mốc đó, công ty xài AI gần như miễn phí để thử nghiệm thả ga; vượt mốc, mỗi token đều bị tính tiền sòng phẳng. Và cái lằn ranh nhỏ xíu này có thể khiến những công ty khôn ngoan… cố tình dừng lại ở 149 người.
Hãy tưởng tượng bạn vừa mua một tấm thẻ gym 200 đô một tháng. Nếu chăm đến mức ngày nào cũng tập, tính ra mỗi buổi rẻ đến mức phòng gym lỗ chỏng vó. Nhưng họ vẫn vui vẻ bán tấm thẻ đó cho cả triệu người — vì biết thừa rằng phần đông sẽ đóng tiền xong rồi… ở nhà.
Hóa ra mấy gói AI bạn đang dùng hằng ngày cũng vận hành đúng kiểu như vậy. Mới đây, một công ty nghiên cứu khá có tiếng tên SemiAnalysis đã ngồi bóc tách và đưa ra một con số làm không ít người dụi mắt: nếu bạn dùng hết công suất gói cao cấp, chi phí thực trên mỗi token có thể rẻ hơn 40 đến 70 lần so với việc gọi thẳng API.
Nghe hơi khó tin đúng không? Mình cũng nghĩ vậy, cho đến khi xem kỹ. Và điều thú vị là: con số đó không phải dấu hiệu bong bóng AI sắp nổ. Nó là bằng chứng của một nước cờ định giá cực kỳ tính toán — nơi startup nhỏ được bao nuôi, còn các ông lớn thì âm thầm gánh phần lời.
Vậy con số 70 lần là thật hay nói cho vui?
Thật. Và đây là cách họ tính. Gói ChatGPT Pro 200 đô nếu xài cạn quota sẽ tương đương khoảng 14.000 đô tiền API — tức chênh nhau 70 lần. Gói Claude Max ở mức cao nhất cũng vậy, một tháng 200 đô nhưng nếu quy ra API thì rơi vào tầm 8.000 đô, chênh chừng 40 lần.
Mà không phải mỗi SemiAnalysis nói. Có một anh lập trình viên rảnh rỗi tự viết hẳn một công cụ để đo xem mình "xài" hết bao nhiêu tiền API mỗi tháng trên gói Max — kết quả ra gần 1.428 đô giá trị tương đương. Còn theo MindStudio, biên lợi nhuận phần inference của Anthropic đã nhảy từ 38% lên 70% chỉ trong vỏn vẹn một năm. Tức là họ thừa sức bao, và vẫn lời.
Thế thì có phải họ đang đốt tiền chờ ngày sụp không?
Không hẳn. Và đây mới là chỗ hay. Quay lại chuyện cái thẻ gym: phòng tập dám bán giá hào phóng vì họ hiểu rất rõ một sự thật — phần lớn người mua sẽ không bao giờ đến đủ. AI cũng y chang.
Người dùng chia làm hai nhóm rất rạch ròi:
Nhóm "nhẹ đô" chiếm khoảng 80%: hỏi vài câu, tạo dăm tấm ảnh, mỗi tháng dùng đâu đó 5–20% quota rồi thôi. Nhóm này platform lời.
Nhóm "nghiện nặng" là 20% còn lại: code mỗi ngày, bật agent chạy thâu đêm, nhét tài liệu dài cả trăm trang. Nhóm này platform lỗ trên từng người.
SemiAnalysis tính ra rằng nếu người dùng trung bình chỉ "ăn" khoảng 20% công suất, thì Anthropic gần như hòa vốn ở gói Max tầm trung. Mà 20% nghe ra vẫn còn… hơi cao so với cách đa số chúng ta dùng thật.
Nói cách khác, đây không phải làm từ thiện. Đây là nghệ thuật phân tầng khách hàng: lấy phần đông xài ít bù cho phần ít xài nhiều, và để cái phân phối lệch đó tự nuôi cả mô hình. Khôn, chứ không liều.
Một vòng qua bảng giá (tháng 6/2026)
Để dễ hình dung, đây là các mức giá hiện tại của Claude. Bạn không cần nhớ hết — chỉ cần để ý đúng một dòng cuối cùng.
| Gói | Giá | Dành cho ai |
|---|---|---|
| Free | 0đ | Dùng chơi, thử cho biết |
| Pro | 20đ/tháng | Cá nhân dùng đều |
| Max | 100–200đ/tháng | Dân code, dùng nặng |
| Team | 25–125đ/ghế/tháng | Đội nhóm, tối đa 150 ghế |
| Enterprise | Báo giá riêng + tiền token | Tập đoàn, từ 150 ghế trở lên |
Đơn vị "đ" trong bảng là đô-la Mỹ. Nguồn tổng hợp ở cuối bài.
Dòng cuối cùng đó chính là nhân vật chính của câu chuyện. Gói Team chỉ cho tối đa 150 ghế. Quá con số này, bạn buộc phải nhảy lên Enterprise — và lúc đó cách tính tiền đổi hẳn: tiền ghế tính riêng, tiền token tính riêng. Bên ChatGPT cũng kẻ đúng một đường tương tự: bản Enterprise đòi tối thiểu 150 chỗ, hợp đồng ký theo năm. Hai ông lớn vô tình tạo ra một "chuẩn ngầm" của cả ngành ngay tại con số 150.
Token là cái đồng hồ điện của thời AI
Chỗ này cần nói rõ một chút, vì nó là gốc rễ của mọi thứ. Mỗi token không phải con số trừu tượng trên màn hình — nó là thời gian GPU, là điện, là phần cứng hao mòn dần. Đây là điểm khác Netflix một trời một vực: Netflix cho bạn xem thêm một bộ phim gần như chẳng tốn thêm xu nào, còn AI thì mỗi câu hỏi bạn gõ ra đều "ăn" một lượng điện và máy móc có thật.
Mỗi câu hỏi đều đốt điện thật — và đó là lý do các hãng buộc phải chia khách theo túi tiền.
Với người dùng gói thuê bao — cá nhân, hay startup nhỏ dưới mốc 150 người — thì token tiếp theo gần như miễn phí, vì đã trả tiền trọn gói rồi. Hệ quả là họ được khuyến khích thử nghiệm điên cuồng: bật mười phiên Claude Code cùng lúc, cho agent chạy qua đêm, sai thì làm lại. Cái gói thuê bao biến thành một kiểu ngân sách R&D được bao trọn.
Còn với khách Enterprise — từ 150 nhân viên trở lên — thì ngược lại hoàn toàn. Mỗi token đều tính tiền ở mức cộng lời cao, biên lợi nhuận quanh 75%. Nghĩa là mỗi đồng họ bỏ ra, platform giữ lại khoảng 75 xu. Trong cái khung đó, việc "thử nghiệm linh tinh xem sao" trở thành một thứ xa xỉ — vì mỗi lần thử đều có hóa đơn đi kèm.
Đây chính là nghịch lý buồn cười của nền kinh tế AI hôm nay: những công ty to nhất, trả nhiều tiền nhất, lại là những công ty dám thử nghiệm ít nhất. Microsoft, Amazon, Google vừa đổ hàng chục tỷ đô mua chip, vừa là khách Enterprise sộp nhất nên trả giá đắt nhất. Trong khi đó một startup mười người có thể nghịch AI thâu đêm với chi phí trên mỗi token gần bằng không, chỉ vì đã đóng 200 đô trọn gói.
Con số 149, và một bài học cũ từ nước Pháp
Nếu bạn thấy chuyện "cố tình dừng ở 149 người" nghe hơi hoang đường, thì xin thưa: nó đã từng xảy ra rồi, ở quy mô cả một quốc gia.
Tại Pháp, khi một công ty chạm mốc 50 nhân viên, hàng loạt quy định lao động khắt khe lập tức đổ ập xuống: phải lập hội đồng lao động, phải đóng thêm các loại quỹ, phải nộp đủ thứ báo cáo. Kết quả là gì? Thống kê cho thấy một hiện tượng kỳ lạ đến mức buồn cười — rất nhiều công ty có đúng 49 nhân viên, và rất hiếm công ty 51. Cứ như có một bức tường vô hình dựng ngay tại con số 50.
Cơ quan thống kê Pháp (INSEE) còn đo được hẳn: nếu gỡ bỏ cái ngưỡng 50 đó đi, tỷ lệ công ty cỡ vừa sẽ nhích lên thấy rõ. Nói cách khác, chính quy định đã tạo ra một "hố trọng lực" hút các công ty nằm lì bên dưới, thay vì lớn lên.
Giờ thì áp đúng logic ấy vào thế giới AI. Một startup thế hệ mới hoàn toàn có thể tính toán để dừng ở 149 người, chỉ để giữ tấm vé Team Plan với chi phí token gần bằng không. Dưới ngưỡng: thử nghiệm thả ga. Vượt ngưỡng: mỗi token một hóa đơn, chi phí nghịch ngợm bỗng đội lên. Và khi cái lợi nó rõ ràng đến vậy, người ta sẽ chọn ở lại 149 — không phải vì ghét lớn, mà vì cấu trúc khuyến khích họ làm thế.
Triết lý của công ty kiểu mới gói gọn trong một câu: ít người hơn, nhiều agent hơn, thuê ngoài nhiều hơn, tự động hóa tối đa.
Vậy việc làm sẽ biến mất theo kiểu nào?
Lâu nay khi nói về AI và việc làm, ta hay tưởng tượng cảnh các tập đoàn khổng lồ sa thải hàng loạt sau khi robot thay người. Nhưng cấu trúc chi phí phân tầng ở trên gợi ý một kịch bản tinh vi hơn nhiều — và có lẽ đúng hơn.
Bên trong các ông lớn, vì mỗi token đều tốn tiền, họ chỉ dám tự động hóa những việc đã thấy rõ lời. Vô số cơ hội cải tổ khác bị bỏ lỡ, đơn giản vì… thử nghiệm đắt quá. Trong khi đó, đám startup token-gần-bằng-không thì thử mọi thứ, và thi thoảng vớ được những cách làm mà ông lớn chẳng buồn ngó tới.
Việc làm không mất vì các ông lớn sa thải, mà mất vì một startup AI giành thị phần — và startup đó chạy bằng 149 người, thay vì 5.000.
Số liệu cũng nói gần như vậy. Nghiên cứu của Harvard Business School thấy generative AI kéo tin tuyển dụng cho các vị trí dễ bị thay thế giảm 17%, trong khi những vị trí được AI hỗ trợ (chứ không thay thế) lại tăng 22%. MIT Sloan thì phát hiện: khi AI làm được hầu hết đầu việc của một vai trò, nhân sự ở đó giảm khoảng 14% — nhưng nếu AI chỉ gánh được vài phần việc, tổng số nhân sự thậm chí có thể tăng, vì công ty năng suất hơn nên lớn nhanh hơn và tuyển thêm.
Ở tầm vĩ mô, McKinsey ước tính AI có thể tự động hóa 60–70% các hoạt động công việc hiện tại trước năm 2030. Diễn đàn Kinh tế Thế giới thì vẽ ra bức tranh: 92 triệu việc làm mất đi, nhưng 170 triệu việc mới sinh ra — cộng lại vẫn dương gần 78 triệu. Vấn đề lớn nhất, như mọi khi, không nằm ở con số tổng, mà ở chỗ người mất việc và người được việc thường không phải cùng một người.
Khoan đã — đừng vội tin hết
Mình thích câu chuyện 149 này, nhưng thành thật mà nói, nó đứng trên vài cái cọc khá lung lay. Để công bằng, đây là những chỗ có thể làm cả lập luận đổ sụp.
Một, cái phần "bao nuôi" hoàn toàn có thể biến mất. Biên lời inference của Anthropic đã tăng vùn vụt, doanh thu thường niên thì bùng từ 9 tỷ cuối 2025 lên hơn 30 tỷ đô — thêm gần 96 triệu mỗi ngày. Khi đã lời khỏe và tiền về ào ạt, áp lực phải bao giá rẻ sẽ nhạt dần, và bảng giá có thể đổi bất cứ lúc nào.
Hai, con số 150 không phải khắc trên đá. Đây là quyết định kinh doanh của công ty tư nhân, không phải luật. Họ thích thì thêm bậc ở giữa, dời ngưỡng, đổi cách tính — chẳng ai cấm. Khác hẳn ngưỡng 50 của Pháp vốn được luật pháp ràng chặt.
Ba, mô hình gym chỉ chạy được khi người ta xài lệch. Nếu mai mốt ai cũng bật agent chạy cả ngày, đám đông "đóng tiền rồi ở nhà" biến mất, thì mô hình thuê bao không giới hạn sẽ vỡ. Nhiều khả năng tương lai sẽ là kiểu lai: gói cứng cộng thêm phần vượt mức tính tiền riêng.
Bốn, ngay cả cái biên lời 75% cũng đang tụt. Một số phân tích cho thấy nó từng chạm 75% rồi rơi về tầm 55% sau các đợt giảm giá. 75% là đỉnh, không phải mặt bằng — và cạnh tranh càng gắt thì nó càng mỏng. Mà nói cho cùng, các ông lớn cũng đâu hoàn toàn chịu thiệt: họ vừa là khách, vừa là chủ hoặc nhà đầu tư của chính các lab AI, nên thừa sức đàm phán deal riêng hoặc tự xây mô hình của mình.
Tóm lại, đây là một xu hướng đáng để ý, chứ không phải định luật bất biến. Đọc để hiểu cuộc chơi, đừng đọc để đặt cược cả công ty.
Rốt cuộc mô hình nào sẽ sống sót?
Một phân tích từ 36kr gợi ý rằng sẽ không có một mô hình "đúng" duy nhất, mà cả ba kiểu dưới đây cùng tồn tại, mỗi kiểu hợp với một loại khách:
| Kiểu | Cách tính tiền | Ví dụ |
|---|---|---|
| Thẻ gym | Trọn gói, dựa vào số đông xài ít | Claude Pro, ChatGPT Plus |
| Dịch vụ đám mây | Xài bao nhiêu trả bấy nhiêu | API doanh nghiệp, AWS Bedrock |
| Trả theo kết quả | Tính tiền theo việc làm xong | Cursor (mỗi task), phí rà soát pháp lý bằng AI |
Xu hướng dài hơi thì khá rõ: phía người dùng cá nhân sẽ dần rời bỏ kiểu "không giới hạn" để sang gói cứng cộng phần vượt mức; phía doanh nghiệp sẽ chuyển từ tính theo đầu người sang tính theo lượng dùng và theo giá trị. Còn "trả theo kết quả" có lẽ là đích đến cuối cùng — khi AI đủ đáng tin để người ta dám trả tiền cho thứ nó làm ra, thay vì thứ nó tiêu thụ.
Công ty của tương lai trông sẽ ra sao?
Nếu cái ngưỡng 150 thật sự trở thành "điểm gãy" của quản trị, thì công ty lý tưởng của thập kỷ tới có lẽ sẽ mang dáng hình thế này: khoảng 149 người để giữ chi phí token rẻ; bộ máy phẳng, ít tầng nấc, tổ chức quanh kết quả thay vì phòng ban; mỗi nhân sự "cầm" theo cả đàn agent chạy song song; mạnh dạn thuê ngoài những việc không cần hiểu nội bộ; và quan trọng nhất — thử nghiệm nhiều hơn, nhanh hơn, rẻ hơn hẳn các đối thủ to xác.
Đây không phải viễn cảnh màu hồng gì cả. Nó chỉ đơn giản là phản ứng hợp lý của những người tỉnh táo trước một cấu trúc chi phí có thật. Hệt như các công ty Pháp nằm lì ở 49 người không phải vì họ ghét phát triển — mà vì luật chơi đã được sắp đặt để họ làm vậy.
Và đây là câu hỏi đáng để bạn tự hỏi: công ty mình đang đứng ở đâu trên cái thang này? Nếu đang dùng gói Enterprise và trả full giá API, rất có thể bạn đang âm thầm đóng một thứ "thuế token" — mà mấy đối thủ nhỏ hơn bạn thì hoàn toàn không.
Cảm ơn bạn đã đọc tới đây. Nếu thấy thú vị, mình rất vui nếu bạn chia sẻ lại — và để lại bình luận nếu bạn nghĩ cái ngưỡng 149 này là thật, hay chỉ là một câu chuyện đẹp.
Nguồn tham khảo
Tổng hợp từ SemiAnalysis, MindStudio, 36kr, MIT Sloan, Harvard Business School, McKinsey, Diễn đàn Kinh tế Thế giới, INSEE, cùng tài liệu chính thức của Anthropic và OpenAI.
Về kinh tế token & biên lợi nhuận
- SemiAnalysis — phân tích gốc trên X
- Tóm tắt qua @rohanpaul_ai (con số 40–70×)
- Digg — subscription bao cấp như thế nào
- MindStudio — biên lời 38% → 70%
- ksred — tự đo chi phí Claude Code (1.428đ)
- Tanay Jaipuria — tranh luận về biên lời AI
- FutureSearch — biên lời API OpenAI 75% → 55%
- 36kr — mô hình kinh doanh AI là một "phòng gym"?
- GTM Alliance — kinh tế sản phẩm Ai đổi cuộc chơi thuê bao
Về bảng giá & ngưỡng 150
- Suprmind — bảng giá Claude 2026
- Finout — giá Claude cho cá nhân, tổ chức, lập trình viên
- AICodex — Claude Team vs Enterprise
- Inference.net — ChatGPT Enterprise (150 ghế tối thiểu)
- OpenAI — ChatGPT Business là gì
- TechJack — toàn bộ bảng giá ChatGPT 2026
Về ngưỡng nhân sự & thị trường lao động
- AEA — vì sao công ty Pháp kẹt ở 49 người
- INSEE — tác động của ngưỡng quy mô theo luật
- Intelligent Founder — thế nào là startup AI-First
- Innospective — công ty AI-First như một thể chế mới
- Harvard Business School — thay thế hay bổ trợ? (PDF)
- MIT Sloan — AI tác động thị trường lao động Mỹ
- Hung-Yi Chen — AI và sự dịch chuyển việc làm
- Statista — chi tiêu AI của Big Tech 2026
- CNN — Big Tech vẫn mạnh tay chi cho AI
- Investing.com — Big Tech chi 600 tỷ đô cho AI năm 2026