SambaNova、DeepSeek-R1 671Bを最速・最高効率(注1)で提供開始
SambaNova、DeepSeek-R1 671Bを最速・最高効率(注1)で提供開始【写真詳細】
SambaNovaは、DeepSeek-R1 6710億パラメータモデルの推論を効率的に実行するためのハードウェア要件を40ラック(320基のGPU)から1ラック(SambaNova独自のAIアクセラレータであるRDUが16基)に集約し、最新GPUの3倍の速度、5倍の効率を実現
@カリフォルニア州パロアルト、2025年2月13日 — 最も効率的なAI半導体と最速のモデル(注2)を提供する生成AI企業であるSambaNovaは、本日DeepSeek-R1 671BがSambaNova Cloud上で198トークン/秒で稼働していることを発表しました。この速度と効率は他のプラットフォームでは実現できません。
DeepSeek-R1はAIのトレーニングコストを10分の1に削減しましたが、高い推論コストと非効率性が普及の障壁となっていました。SambaNovaはこの障壁を取り除き、リアルタイムでコスト効率の高い大規模推論を開発者や企業向けに提供します。
SambaNovaのCEO兼共同創業者であるロドリゴ・リヤンは「SN40L RDU半導体によって駆動されるSambaNovaは、DeepSeekを198トークン/秒/ユーザーという最速の速度(注1)で実行できるプラットフォームです。この速度は単一ラックで最新GPUの5倍に達し、年末までにはDeepSeek-R1向けのキャパシティを100倍に拡張します」と述べています。
DeepLearning.AIの創設者であり、AI Fundのマネージング・ゼネラル・パートナー、スタンフォード大学コンピュータサイエンス学科の客員教授でもあるアンドリュー・ン博士は次のようにコメントしています。 「SambaNovaの驚異的な速度で、蒸留されたバージョンではなく、フルサイズのDeepSeek-R1 671Bモデルを実行できることは、開発者にとって画期的です。R1のような推論モデルは、優れた出力を得るために多くの推論トークンを生成する必要があり、従来のLLMよりも処理時間が長くなります。したがって、このようなモデルの高速化は特に重要です。」
Artificial Analysisの共同創業者であるジョージ・キャメロン氏は「Artificial Analysisは、SambaNovaのクラウド上で稼働する6710億パラメータのDeepSeek-R1 Mixture of Expertsモデルの独自ベンチマークを実施し、195トークン/秒以上の出力速度を記録しました。これは、これまでに測定したDeepSeek-R1の中で最速の出力速度(注1)です。推論モデルにおいては、高速な出力が特に重要であり、推論トークンの出力速度が向上することで、応答の品質を向上させることができます。SambaNovaの高い出力速度は、レイテンシーに敏感なユースケースでの推論モデルの活用を支援します」と述べています。
SambaNovaがDeepSeekの最大の課題を解決:大規模推論の実現
DeepSeek-R1は、AIのトレーニングコストを10分の1に削減し、AIの発展を加速させました。しかし、推論時に必要な計算量が大幅に増大するため、GPUベースの推論の非効率性がDeepSeek-R1の普及を妨げ、多くの開発者にとって手の届かない存在となっていました。
SambaNovaはこの問題を解決しました。独自のデータフローアーキテクチャと3層メモリ設計により、SambaNovaのSN40L Reconfigurable Dataflow Unit(RDU)チップは、DeepSeek-R1 671Bを実行するためのハードウェア要件を、40ラック(最新GPU320基)から1ラック(16基のRDU)に削減し、コスト効率の高い推論を実現します。
SambaNova CEOのロドリゴ・リヤンは「DeepSeek-R1は最も先進的なフロンティアAIモデルの一つですが、GPUの非効率性がその可能性を制限していました。しかし、本日をもって状況は一変します。推論コストを劇的に削減し、ハードウェア要件を40ラックから1ラックへと縮小し、最高速で効率的なDeepSeek-R1を提供します(注1)」と述べています。
Blackbox AIのCEO、ロバート・リズク氏は「Fortune 500企業のエンジニアリングチームを含む1,000万人以上のユーザーが、Blackbox AIを活用してコードの作成や製品開発を変革しています。SambaNovaとの提携は、自律型コーディングエージェントのワークフローを加速させる上で極めて重要です。SambaNovaの半導体は、フルサイズのDeepSeek-R1 671Bモデルを効率的に提供できる唯一無二の性能を誇り、蒸留版よりも圧倒的に高い精度を実現します。数百万のユーザーを支えるために、これ以上のパートナーは考えられません」と述べています。
近日公開:世界で最も効率的なDeepSeek API – 現在のグローバルキャパシティの100倍
SambaNovaのチーフアーキテクトであるスムティ・ジャイラットは「DeepSeek-R1は、SambaNovaの三層メモリアーキテクチャに最適なモデルです。R1は6710億パラメータを持つ、これまでに公開された最大のオープンソース大規模言語モデルであり、その動作には膨大なメモリが必要となります。従来のGPUはメモリの制約を受けますが、SambaNova独自のデータフローアーキテクチャにより、メモリとデータ通信のボトルネックを克服し、近い将来にはラック全体で毎秒20,000トークンという前例のないスループットを達成できる見込みです。」と述べています。
SambaNovaは、今後の需要の増加に対応するため、計算能力の大幅な拡張を進めています。本年末までに、DeepSeek-R1向けのグローバルな計算リソースを現在の100倍以上に拡大する予定です。これにより、SambaNovaのRDUは、推論モデル向けの最も効率的なエンタープライズソリューションとなります。
SambaNova CloudでR1の早期アクセスを提供開始
DeepSeek-R1 6710億パラメータのフルモデルが、すべてのユーザー向けに提供開始されました。また、一部の選定ユーザーにはAPI経由での利用も可能です。今すぐ体験するには、cloud.sambanova.ai にアクセスしてください。
(注1)Artificial Analysis社調べ
(注2)SambaNova Systems調べ
SambaNova Systems について
最先端の生成AI機能を企業内に迅速に展開するために、SambaNovaに注目が集まっています。 SambaNovaのエンタープライズスケールのために構築されたAIプラットフォームは、次世代の生成AIコンピューティングのための技術的バックボーンです。
カリフォルニア州パロアルトに本社を置くSambaNova Systemsは、業界の著名人や、サン/オラクルおよびスタンフォード大学のハードウェアおよびソフトウェア設計の専門家によって、2017年に設立されました。投資家には、SoftBank Vision Fund 2、BlackRock、Intel Capital、GV、Walden International、Temasek、GIC、Redline Capital、 Atlantic Bridge Ventures、Celestaなどが含まれています。sambanova.ai をご覧いただくか、info@sambanova.ai までご連絡ください。Linkedinで SambaNova Systems をフォローしてください。
プレスリリース情報提供元:ValuePress!
スポンサードリンク
SambaNova Systemsの記事
IT・テクノロジーの最新プレスリリース
- YouTube「華の会チャンネル」~登録後に迷わない!恋活初心者が最初にやるべき3つのこと~
- 【ドスパラ】『新品パソコン全品送料無料キャンペーン』を2月9日(月)10:59まで実施 最短当日出荷・最短翌日出荷対象モデルにも適用

- 他社AIチャットボットからの乗り換えで月額基本料金3ヶ月無料「Botbird for Business」特別乗り換えキャンペーン実施

- JAPANNEXTがAmazon.co.jp限定で最大30%オフのバレンタインセールを2月6日(金)より期間限定で開催!

- セックスレスにならない秘訣は?|セックスレス“じゃない”夫婦の実態調査 第1報

- バレンタインは、甘さより“刺激”を。FANZA通販が「おひとり様のバレンタイン」を全力応援!厳選アイテム500点以上が対象のセールを実施【2月19日まで】

- 【ドスパラ】フォトウォーク プロに学びながら撮影散策花を撮るフォトグラファー北村佑介氏と巡る春の昭和記念公園3月14日(土)開催 撮影機材・カメラ歴不問

- JAPANNEXTが「REANIMAL」発売を記念してゲームソフトや公式グッズが当たるプレゼントキャンペーンを開催!

- 「ビューティーワールド ジャパン 福岡」にLINEを活用した自動予約管理システム「リピッテビューティー」を出展

- 過疎すぎる草マップw、1ヶ月で17名しかユーザーが集まらずAIエージェント100名を導入 ― 人間よりAIの方が多いほぼAI専用SNSが爆誕







































