ウェブサイト

Nvidiaは次世代Fermiアーキテクチャを発表

不要嘲笑我們的性

不要嘲笑我們的性
Anonim

NVIDIONは、 「GPU Technology Conference」へのカンファレンスでも、それはまだNvidiaの展示会です。 CEOのJen-Hsun Huang氏は基調講演の中で、コードネーム「フェルミ(Fermi)」の次世代GPUアーキテクチャを発表するまでに時間を割いた。これはGeForce GTX 285のようなカードにパワーを与えるGT200チップの世代を継承したGT300と呼ばれているチップグラフィックスのファンです。

チップの巨人はチップを新しいグラフィックチップではなく、 " 計算して、グラフィックス"チップ、その順に(イタリック体)。実際、新しいチップについて明らかにされたほとんどすべては、テクスチャユニットやレンダリングのような従来のグラフィック指向のものではなく、その計算上の機能に関連しています。私たちが知っていることは、このチップは推定30億個のトランジスタで巨大であり、TSMCの40nmプロセスで製造されることです。これは、ライバルのAMDが直前にリリースした新しいRadeon 5800シリーズDirectX 11カードのRV870チップよりも約40%多いトランジスタです。このチップには、それぞれ32コアの16個の「ストリーミング・マルチプロセッサ」で構成された512個の処理ユニット(NvidiaがCUDAコアと呼んでいます)があります。これはGT200の240コアの2倍以上であり、コアは大幅に強化されています。 第3世代ストリーミングマルチプロセッサー(SM)

32 SMU当たり32個のCUDAコア、GT200上に4×899×899個のCUDAコアGT200以上のピーク倍精度浮動小数点性能

2スレッドの32スレッド/クロック

  • をスケジューリングおよびディスパッチするデュアルワープスケジューラ
  • 64 KBのRAM、共有メモリとL1キャッシュの設定可能なパーティション分割
  • 秒生成された並列スレッド実行ISA
  • 完全なC ++サポートによる統一アドレス空間
  • OpenCLおよびDirectCompute向けに最適化された

完全なIEEE 754-2008 32ビットおよび64ビット精度

  • 64ビットの完全32ビット整数パス(
  • )改善されたメモリサブシステム
  • 設定可能なL1およびUnified L2
  • キャッシュを備えたNVIDIAパラレルデータキャッシュ階層
  • 64ビットアドレッシングへの移行をサポートするメモリアクセス命令
  • ECCメモリをサポートした最初のGPU

大幅なアトミックメモリ操作の向上パフォーマンス

  • NVIDIA GigaThread Engine
  • 10倍高速のアプリケーションコンテキスト切り替え
  • 同時カーネル実行
  • 順不同スレッドブロック実行

デュアルオーバーラップメモリ​​転送エンジン

  • はるかに高速な倍精度浮動小数点計算速度のようなストリームコンピューティングタスクでこのチップの性能。現行のNVIDIA GPUは、単精度オペレーションの速度の半分で倍精度を計算します。倍精度浮動小数点演算は単精度の性能の半分になるはずです。これは大きな改善です。キャッシュとスケジューリングの大きな改善点も明らかです。あなたは、このホワイトペーパーを含むNvidiaの新しいFermiページでアーキテクチャの詳細を読むことができます。
  • このチップを使用するグラフィックカードは、いつ購入できますか? Nvidiaは言っていない。会社の代表者は、彼らが現在「チップを持ち上げている」と言いました。つまり、作業サンプルは最近製造工場から戻ってきました。過去の歴史から学んだ推測をすると、12月は楽観的なリリース日であり、2010年第1四半期は幅広い利用可能性が高いと言えます。ボードは高価であると予想します。 Nvidiaはチップサイズを公表しませんが、トランジスタ数で判断すると、450〜500mm
  • 2
  • と推測されます。 384ビットのメモリインターフェイスの追加ボードコストと、比較的新しい40nm製造プロセスでこのような巨大なチップから優れた歩留まりを得るという課題と相まって、さらに強力でAMDのちょうどリリースされたRadeon 5800シリーズカードよりも高価です。

TwitterでJason Crossをフォローするか、彼のブログをご覧ください。