SambaNova、DeepSeek-R1 671Bを最速・最高効率(注1)で提供開始
SambaNova、DeepSeek-R1 671Bを最速・最高効率(注1)で提供開始【写真詳細】
SambaNovaは、DeepSeek-R1 6710億パラメータモデルの推論を効率的に実行するためのハードウェア要件を40ラック(320基のGPU)から1ラック(SambaNova独自のAIアクセラレータであるRDUが16基)に集約し、最新GPUの3倍の速度、5倍の効率を実現
@カリフォルニア州パロアルト、2025年2月13日 — 最も効率的なAI半導体と最速のモデル(注2)を提供する生成AI企業であるSambaNovaは、本日DeepSeek-R1 671BがSambaNova Cloud上で198トークン/秒で稼働していることを発表しました。この速度と効率は他のプラットフォームでは実現できません。
DeepSeek-R1はAIのトレーニングコストを10分の1に削減しましたが、高い推論コストと非効率性が普及の障壁となっていました。SambaNovaはこの障壁を取り除き、リアルタイムでコスト効率の高い大規模推論を開発者や企業向けに提供します。
SambaNovaのCEO兼共同創業者であるロドリゴ・リヤンは「SN40L RDU半導体によって駆動されるSambaNovaは、DeepSeekを198トークン/秒/ユーザーという最速の速度(注1)で実行できるプラットフォームです。この速度は単一ラックで最新GPUの5倍に達し、年末までにはDeepSeek-R1向けのキャパシティを100倍に拡張します」と述べています。
DeepLearning.AIの創設者であり、AI Fundのマネージング・ゼネラル・パートナー、スタンフォード大学コンピュータサイエンス学科の客員教授でもあるアンドリュー・ン博士は次のようにコメントしています。 「SambaNovaの驚異的な速度で、蒸留されたバージョンではなく、フルサイズのDeepSeek-R1 671Bモデルを実行できることは、開発者にとって画期的です。R1のような推論モデルは、優れた出力を得るために多くの推論トークンを生成する必要があり、従来のLLMよりも処理時間が長くなります。したがって、このようなモデルの高速化は特に重要です。」
Artificial Analysisの共同創業者であるジョージ・キャメロン氏は「Artificial Analysisは、SambaNovaのクラウド上で稼働する6710億パラメータのDeepSeek-R1 Mixture of Expertsモデルの独自ベンチマークを実施し、195トークン/秒以上の出力速度を記録しました。これは、これまでに測定したDeepSeek-R1の中で最速の出力速度(注1)です。推論モデルにおいては、高速な出力が特に重要であり、推論トークンの出力速度が向上することで、応答の品質を向上させることができます。SambaNovaの高い出力速度は、レイテンシーに敏感なユースケースでの推論モデルの活用を支援します」と述べています。
SambaNovaがDeepSeekの最大の課題を解決:大規模推論の実現
DeepSeek-R1は、AIのトレーニングコストを10分の1に削減し、AIの発展を加速させました。しかし、推論時に必要な計算量が大幅に増大するため、GPUベースの推論の非効率性がDeepSeek-R1の普及を妨げ、多くの開発者にとって手の届かない存在となっていました。
SambaNovaはこの問題を解決しました。独自のデータフローアーキテクチャと3層メモリ設計により、SambaNovaのSN40L Reconfigurable Dataflow Unit(RDU)チップは、DeepSeek-R1 671Bを実行するためのハードウェア要件を、40ラック(最新GPU320基)から1ラック(16基のRDU)に削減し、コスト効率の高い推論を実現します。
SambaNova CEOのロドリゴ・リヤンは「DeepSeek-R1は最も先進的なフロンティアAIモデルの一つですが、GPUの非効率性がその可能性を制限していました。しかし、本日をもって状況は一変します。推論コストを劇的に削減し、ハードウェア要件を40ラックから1ラックへと縮小し、最高速で効率的なDeepSeek-R1を提供します(注1)」と述べています。
Blackbox AIのCEO、ロバート・リズク氏は「Fortune 500企業のエンジニアリングチームを含む1,000万人以上のユーザーが、Blackbox AIを活用してコードの作成や製品開発を変革しています。SambaNovaとの提携は、自律型コーディングエージェントのワークフローを加速させる上で極めて重要です。SambaNovaの半導体は、フルサイズのDeepSeek-R1 671Bモデルを効率的に提供できる唯一無二の性能を誇り、蒸留版よりも圧倒的に高い精度を実現します。数百万のユーザーを支えるために、これ以上のパートナーは考えられません」と述べています。
近日公開:世界で最も効率的なDeepSeek API – 現在のグローバルキャパシティの100倍
SambaNovaのチーフアーキテクトであるスムティ・ジャイラットは「DeepSeek-R1は、SambaNovaの三層メモリアーキテクチャに最適なモデルです。R1は6710億パラメータを持つ、これまでに公開された最大のオープンソース大規模言語モデルであり、その動作には膨大なメモリが必要となります。従来のGPUはメモリの制約を受けますが、SambaNova独自のデータフローアーキテクチャにより、メモリとデータ通信のボトルネックを克服し、近い将来にはラック全体で毎秒20,000トークンという前例のないスループットを達成できる見込みです。」と述べています。
SambaNovaは、今後の需要の増加に対応するため、計算能力の大幅な拡張を進めています。本年末までに、DeepSeek-R1向けのグローバルな計算リソースを現在の100倍以上に拡大する予定です。これにより、SambaNovaのRDUは、推論モデル向けの最も効率的なエンタープライズソリューションとなります。
SambaNova CloudでR1の早期アクセスを提供開始
DeepSeek-R1 6710億パラメータのフルモデルが、すべてのユーザー向けに提供開始されました。また、一部の選定ユーザーにはAPI経由での利用も可能です。今すぐ体験するには、cloud.sambanova.ai にアクセスしてください。
(注1)Artificial Analysis社調べ
(注2)SambaNova Systems調べ
SambaNova Systems について
最先端の生成AI機能を企業内に迅速に展開するために、SambaNovaに注目が集まっています。 SambaNovaのエンタープライズスケールのために構築されたAIプラットフォームは、次世代の生成AIコンピューティングのための技術的バックボーンです。
カリフォルニア州パロアルトに本社を置くSambaNova Systemsは、業界の著名人や、サン/オラクルおよびスタンフォード大学のハードウェアおよびソフトウェア設計の専門家によって、2017年に設立されました。投資家には、SoftBank Vision Fund 2、BlackRock、Intel Capital、GV、Walden International、Temasek、GIC、Redline Capital、 Atlantic Bridge Ventures、Celestaなどが含まれています。sambanova.ai をご覧いただくか、info@sambanova.ai までご連絡ください。Linkedinで SambaNova Systems をフォローしてください。
プレスリリース情報提供元:ValuePress!
スポンサードリンク
SambaNova Systemsの記事
IT・テクノロジーの最新プレスリリース
- 「LINEヤフー Partner Program」において「Technology Partner」のコミュニケーション部門「Advanced」に認定

- 【ドスパラ】いかに配信者として魅せるか競う『第2回 DCP CHALLENGERS ストリートファイター6』開催決定 挑戦者募集開始 本選はプロ選手等とチーム戦

- 「触ってみた」で終わらせない。札幌商工会議所主催の「生成AI実践講座」に株式会社dott代表・浅井が登壇。

- ECは次世代フェーズへ。AIが変える「これからの購買体験」と米国リテール最新テクノロジーを代表山崎が解説する投資家向けIR動画メディア「IRTV」の動画が公開

- 「SHOW-WA Concert in 日本武道館」開催決定!FC先行受付のご案内!

- 【GALLERIA】豪華5大購入特典つき「崩壊:スターレイル」コラボモデル受注開始 銀狼LV.999デザインケース 先着500台にシリアルコードプレゼント

- 【サードウェーブ】インディーゲームの祭典BitSummit PUNCHにGALLERIAブースを出展 ゲーム開発製作者がストレスなく業務遂行できる環境をご提案

- 【2026年5月22日(金)開催】日本農業新聞主催オンラインセミナー「バックオフィスDX for JA」へパーソルグループから2名が登壇

- eラーニング「Microsoft Outlook 2024(365対応)使い方講座」を法人向けにレンタル開始

- 【FANZA同人】総額10万ポイントが当たる!「春の同人祭」いきぬき亭アンケートキャンペーンを開催【本日から5月11日まで】



































