SambaNova、DeepSeek-R1 671Bを最速・最高効率(注1)で提供開始
SambaNova、DeepSeek-R1 671Bを最速・最高効率(注1)で提供開始【写真詳細】
SambaNovaは、DeepSeek-R1 6710億パラメータモデルの推論を効率的に実行するためのハードウェア要件を40ラック(320基のGPU)から1ラック(SambaNova独自のAIアクセラレータであるRDUが16基)に集約し、最新GPUの3倍の速度、5倍の効率を実現
@カリフォルニア州パロアルト、2025年2月13日 — 最も効率的なAI半導体と最速のモデル(注2)を提供する生成AI企業であるSambaNovaは、本日DeepSeek-R1 671BがSambaNova Cloud上で198トークン/秒で稼働していることを発表しました。この速度と効率は他のプラットフォームでは実現できません。
DeepSeek-R1はAIのトレーニングコストを10分の1に削減しましたが、高い推論コストと非効率性が普及の障壁となっていました。SambaNovaはこの障壁を取り除き、リアルタイムでコスト効率の高い大規模推論を開発者や企業向けに提供します。
SambaNovaのCEO兼共同創業者であるロドリゴ・リヤンは「SN40L RDU半導体によって駆動されるSambaNovaは、DeepSeekを198トークン/秒/ユーザーという最速の速度(注1)で実行できるプラットフォームです。この速度は単一ラックで最新GPUの5倍に達し、年末までにはDeepSeek-R1向けのキャパシティを100倍に拡張します」と述べています。
DeepLearning.AIの創設者であり、AI Fundのマネージング・ゼネラル・パートナー、スタンフォード大学コンピュータサイエンス学科の客員教授でもあるアンドリュー・ン博士は次のようにコメントしています。 「SambaNovaの驚異的な速度で、蒸留されたバージョンではなく、フルサイズのDeepSeek-R1 671Bモデルを実行できることは、開発者にとって画期的です。R1のような推論モデルは、優れた出力を得るために多くの推論トークンを生成する必要があり、従来のLLMよりも処理時間が長くなります。したがって、このようなモデルの高速化は特に重要です。」
Artificial Analysisの共同創業者であるジョージ・キャメロン氏は「Artificial Analysisは、SambaNovaのクラウド上で稼働する6710億パラメータのDeepSeek-R1 Mixture of Expertsモデルの独自ベンチマークを実施し、195トークン/秒以上の出力速度を記録しました。これは、これまでに測定したDeepSeek-R1の中で最速の出力速度(注1)です。推論モデルにおいては、高速な出力が特に重要であり、推論トークンの出力速度が向上することで、応答の品質を向上させることができます。SambaNovaの高い出力速度は、レイテンシーに敏感なユースケースでの推論モデルの活用を支援します」と述べています。
SambaNovaがDeepSeekの最大の課題を解決:大規模推論の実現
DeepSeek-R1は、AIのトレーニングコストを10分の1に削減し、AIの発展を加速させました。しかし、推論時に必要な計算量が大幅に増大するため、GPUベースの推論の非効率性がDeepSeek-R1の普及を妨げ、多くの開発者にとって手の届かない存在となっていました。
SambaNovaはこの問題を解決しました。独自のデータフローアーキテクチャと3層メモリ設計により、SambaNovaのSN40L Reconfigurable Dataflow Unit(RDU)チップは、DeepSeek-R1 671Bを実行するためのハードウェア要件を、40ラック(最新GPU320基)から1ラック(16基のRDU)に削減し、コスト効率の高い推論を実現します。
SambaNova CEOのロドリゴ・リヤンは「DeepSeek-R1は最も先進的なフロンティアAIモデルの一つですが、GPUの非効率性がその可能性を制限していました。しかし、本日をもって状況は一変します。推論コストを劇的に削減し、ハードウェア要件を40ラックから1ラックへと縮小し、最高速で効率的なDeepSeek-R1を提供します(注1)」と述べています。
Blackbox AIのCEO、ロバート・リズク氏は「Fortune 500企業のエンジニアリングチームを含む1,000万人以上のユーザーが、Blackbox AIを活用してコードの作成や製品開発を変革しています。SambaNovaとの提携は、自律型コーディングエージェントのワークフローを加速させる上で極めて重要です。SambaNovaの半導体は、フルサイズのDeepSeek-R1 671Bモデルを効率的に提供できる唯一無二の性能を誇り、蒸留版よりも圧倒的に高い精度を実現します。数百万のユーザーを支えるために、これ以上のパートナーは考えられません」と述べています。
近日公開:世界で最も効率的なDeepSeek API – 現在のグローバルキャパシティの100倍
SambaNovaのチーフアーキテクトであるスムティ・ジャイラットは「DeepSeek-R1は、SambaNovaの三層メモリアーキテクチャに最適なモデルです。R1は6710億パラメータを持つ、これまでに公開された最大のオープンソース大規模言語モデルであり、その動作には膨大なメモリが必要となります。従来のGPUはメモリの制約を受けますが、SambaNova独自のデータフローアーキテクチャにより、メモリとデータ通信のボトルネックを克服し、近い将来にはラック全体で毎秒20,000トークンという前例のないスループットを達成できる見込みです。」と述べています。
SambaNovaは、今後の需要の増加に対応するため、計算能力の大幅な拡張を進めています。本年末までに、DeepSeek-R1向けのグローバルな計算リソースを現在の100倍以上に拡大する予定です。これにより、SambaNovaのRDUは、推論モデル向けの最も効率的なエンタープライズソリューションとなります。
SambaNova CloudでR1の早期アクセスを提供開始
DeepSeek-R1 6710億パラメータのフルモデルが、すべてのユーザー向けに提供開始されました。また、一部の選定ユーザーにはAPI経由での利用も可能です。今すぐ体験するには、cloud.sambanova.ai にアクセスしてください。
(注1)Artificial Analysis社調べ
(注2)SambaNova Systems調べ
SambaNova Systems について
最先端の生成AI機能を企業内に迅速に展開するために、SambaNovaに注目が集まっています。 SambaNovaのエンタープライズスケールのために構築されたAIプラットフォームは、次世代の生成AIコンピューティングのための技術的バックボーンです。
カリフォルニア州パロアルトに本社を置くSambaNova Systemsは、業界の著名人や、サン/オラクルおよびスタンフォード大学のハードウェアおよびソフトウェア設計の専門家によって、2017年に設立されました。投資家には、SoftBank Vision Fund 2、BlackRock、Intel Capital、GV、Walden International、Temasek、GIC、Redline Capital、 Atlantic Bridge Ventures、Celestaなどが含まれています。sambanova.ai をご覧いただくか、info@sambanova.ai までご連絡ください。Linkedinで SambaNova Systems をフォローしてください。
プレスリリース情報提供元:ValuePress!
スポンサードリンク
SambaNova Systemsの記事
IT・テクノロジーの最新プレスリリース
- JAPANNEXTがモニター上部に設置し、手元を明るく照らすモニターライト4機種を5月2日(金)に同時発売
- JAPANNEXTが23.8インチ IPSパネル 120Hz/0.5m対応 USB-C給電可能なフルHDゲーミングモニターを20,980円で5月2日(金)に発売
- 【ドスパラ】RTX5070搭載 一部対象モデルが期間限定送料無料ドスパラならカスタマイズしても最短翌日出荷 GWは新しいPCで楽しもう
- 華の会メール「恋愛コラム」~独身年金一人暮らしのシニアが寂しい時に友達や話し相手、恋人の作り方~
- 【5/10(土)放送】金沢シーサイドFMのラジオ番組「社長!あなたの会社教えてください。」に代表取締役社長の山崎が出演
- FANZAブックス「10円セール」第3弾を開催!「10円クエスト」報酬の3シリーズ全話も10円に!【5月8日まで】
- 欧州企業からエンタープライズ用次世代サーマルスマートグラス向けウェーブガイドを受注
- 『華の会メール』が杉本彩さんを起用!~大人のための恋愛コミュニティをさらに魅力的に~
- インスタグラム自動化ツール「エルグラム」初心者向け解説動画公開
- エンジニア・DX人材育成サービス『TECH PLAY Academy』、もう、失敗で終わらせない。現場を再起動させるDX人材育成オンラインセミナーを開催