SSブログ
テクノロジー ブログトップ
- | 次の8件

劇的な性能向上を果たし、人工知能開発を加速させるGPU。 [テクノロジー]

NVIDIA社が最新世代のGPU アーキテクチャである " Pascal " ベースとなる、 " Tesla P100 " を " GPU Technology Conference " (GTC)で発表したそうです。

PC Watch / 後藤弘茂のWeekly海外ニュース / "革新アーキテクチャ「Pascal」はNVIDIA GPUのマイルストーンに" のURL:
http://pc.watch.impress.co.jp/docs/column/kaigai/20160406_751980.html

この " Tesla P100 " は製造プロセス技術が久々に躍進して、従来の28nm プレーナー トランジスター プロセスから、16nm FinFET 3D トランジスター プロセスに変わったとの事。
トランジスターの集積度の向上は勿論の事、消費電力が大幅に削減され、動作周波数も向上し、プロセス技術面だけでも大幅な性能の向上となるそうです。
メモリーに関しては16[GB]のHBM2 メモリーが使用されるそうで、シリコン インターポーザーを介してGPU チップとメモリー チップが接続されます。
メモリー チップは複数枚が垂直に積層されます。
Through Silicon Via (TSV)技術によってチップを垂直に貫通する電極が形成され、積層された各チップ間が超広帯域接続されます。
そのメモリー帯域幅は何と驚異の720[GB/second]にも達するそうです。
HBM2 メモリーの帯域幅は近い将来に1[TB/second]にまで拡張される見込みであるそうです。
Pascal アーキテクチャーのGPUはNVLinkというチップ間接続規格を使用し、8個のGPUを超広帯域接続可能だそうです。
更にNVLinkに対応しているPower アーキテクチャー系CPUも超広帯域接続出来るとの事。
トランジスターの集積規模の増大も凄く、前世代のMaxwellの最大構成であるGM200では80億トランジスターだったのが、 " Tesla P100 " では何と、1つのダイの上に153億個ものトランジスターを搭載していると言います。
演算性能に関しては、単精度(32bit精度)浮動小数点数演算性能が、7[TFLOPS]から10.6[TFLOPS]へと大幅な向上を果たしたそうです。
更に倍精度(64bit精度)浮動小数点数演算性能及び半精度(16bit精度)浮動小数点数演算性能も大幅に強化され、レジスター数とスレッド数とシェアード メモリーも大幅に増えたようです。

とにかく今回の " Pascal " アーキテクチャーの " Tesla P100 " GPUの性能向上度合いは凄まじい模様です。

加えて、超低消費電力で " Deep Convolutional Neural Network " (DCNN)という人工ニューラル ネットワークの処理が可能な " Eyeriss " と名付けられたチップも発表されたそうです。
これはドローンやスマートフォンを含む様々な小型の組み込み機器で高度な人工知能を実装出来るようにする為の製品だそうです。

PC Watch / 後藤弘茂のWeekly海外ニュース / "NVIDIAが主催するGTCに、ディープラーニング専用チップ「Eyeriss」が登場" のURL:
http://pc.watch.impress.co.jp/docs/column/kaigai/20160406_751753.html


そして、NVIDIA社は " Tesla P100 " GPUを8基搭載した自社製のサーヴァーである " DGX-1 " を発表したそうです。
これは2015年に発表された前世代のサーヴァーと比較して、機械学習の性能が12倍にまで向上しているのだそうです。


今回発表された製品の性能向上度合いは驚異的です。
そして、NVIDIA社はこれらの製品を完全に人工知能の実装の為に開発したようです。

部屋の片隅に設置されたラックマウント サーヴァーが、体育館程の大きさがあった一昔前の最大規模のスーパーコンピューターと同等の性能を実現するとは驚かされます。


こうした製品の登場により、確実に人工知能開発が進むでしょう。
自動運転自動車や自動文書作成、自動宅配サーヴィス、パーソナル アシスタント等は早期に実現するでしょうし、それ以上の、汎用人工知能、肉体労働を何でもこなす人型ロボットも実現するかもしれません。
意外に遠くない未来に、オラクルを超えてジニーやソヴリンが実現するかもしれません。



コンピューターの性能が100倍になって欲しい。 [テクノロジー]

私は2016年3月現在、Intel Ivy Bridge マイクロ アーキテクチャー世代のCPUである、 " Core i7-3770T " と、DDR3 SDRAM PC3-12800 8GB x 4枚(32GB)を搭載したPCを使用しております。
このシステムは、私が使用していたそれ以前の世代のものと比べて桁違いに高性能で、快適になったと感じておりました。
しかしながら、それでも大量の大きな画像を処理したり、膨大な量のデータベースを処理したりする作業には全くと言って良い程性能が足りません。
畳み込みニューラル ネットワークによる大量の画像処理や、大量の画像中の特徴点抽出とブロック マッチングと幾何学変形と合成等の処理を32bit精度で行おうとすると、私のPCでは1か月間もの時間が掛かってしまいます。

メイン メモリーは32GBでは全然足りておらず、例えばワールド ワイド ウェブのインデックスを必要な分だけ快適に処理しようとすれば4TB位のRAMが必要です。
メイン メモリーの帯域幅も、たとえDDR4規格のメモリーを使用しても充分ではなく、更に10倍以上の転送速度が欲しいところです。

ストレージについてはHDDでは転送速度が全く足りず、SSDを10TB位は使いたいところです。

そしてCPUですが、現在のCore i7のハイエンド製品でも恐らく全く足りず、欲を言えば100倍以上の演算処理性能が欲しいと思います。

個人的なPCの利用の範囲でもその位の性能に対する要求がある訳でございます。



ところで、今後訪れるであろう社会では、ロボットや人工知能の開発による生産性の向上速度に対して世界の人々の製品やサーヴィスの需要が追いつかず、人間の労働力が必要とされない状況になると予想されております。
すると、多くの人々が充分な条件の仕事に就けなくなる訳ですから、今、議論が盛んになっているベーシック インカム制度を導入せざるを得なくなる時がやって来ます。

その時、人々がそれまで行っていた全ての仕事を代替可能な高度で知的な人工知能を搭載したロボットが絶対に必要になります。
しかし、そのレヴェルの人工知能を実現するには、現在のコンピューターと比較して1,000倍近い性能が求められます。

ところが現在、集積回路上に作られるトランジスター数が18か月毎に2倍になるという、嘗てのムーアの法則は持続困難な状況になりつつあり、それ以上に問題なのがトランジスター数の増加に比べて演算性能の向上度合いが低いという事です。
その為、嘗てと比較してCPUの処理性能向上は明確に鈍化しており、従って人間の仕事を代替可能な知性を持つロボットの登場は従来予想よりも遅くなる可能性もございます。

一方で、現実にはソフトウェア面の進化が従来予想よりも早く、例えば最も盤面状態数が多いボード ゲームである囲碁の勝負に於いて、コンピューターが世界最高峰のプロ棋士に勝利するのは10年位先の話とされていたところ、Google DeepMind社のAlphaGoという人工知能が既に4勝1敗で囲碁の世界の最高峰棋士であるイ セドルさんに勝利してしまいました。

この様に予想以上のソフトウェアの発展、或いはコンピューター ハードウェアの抜本的な技術革新が起こる事で人間の知性を上回る人工知能の登場時期が早まる可能性も存在しております。

カーボン ナノチューブ トランジスター、シリコン ナノワイヤー、グラフェン トランジスター、Silicene、Phosphorene、等の新規材料、新規構造、そして高速大容量な不揮発性メモリーが実用化されれば、コンピューターの性能が一気に何桁も向上致します。

何れにせよ、コンピューターの性能向上は止まらず、遠くない将来に於いて人間の知能を上回って行く事でしょう。

刑事ドラマの画像処理技術について [テクノロジー]

昔、 "超解像" "Super-Resolution" が話題になっていた頃、TVの高画質化に役立つという点で注目されていたように思います。
現在ではTV放送はFull HDの次、UHD (4K)へ向かっております。
TVでは実時間で画像処理する必要がある為、主に1枚フレーム内超解像技術が搭載されております。
ですが、番組コンテンツの撮影と編集が4K以上の解像度で行われれば、超解像処理の必要性は低下致します。
このまま超解像技術、特に "複数枚超解像技術" はマイナーなものになってしまうのかなと思っていたのですが、犯罪捜査には活用されているようです。

主に防犯カメラの映像の鮮明化に利用されているそうです。


アレです。テレビ放送の刑事ドラマなどで頻繁に出てくるあのシーンです。


「現場近くの防犯カメラに怪しい人物が映っていました!」

(防犯カメラ映像を見ながら)
「ダメですね。これじゃ犯人の顔かどうか分からない。」

「私が画像処理で鮮明化してみます。」

(鮮明化した拡大画像を見ながら)
「...こいつだ!犯人の顔に間違いない!」


アレはドラマでは効果が誇張されてはおりますが、それに近い事が可能なのですね。

例えば、株式会社デジタルデザイン の 捜査支援用画像処理システム イメージレポーター という製品は様々な映像の多数枚のフレームを用いて、1画素よりも細かい、サブピクセル レベルでのブロック マッチングで元々の解像度以上の情報を引き出します。ノイズも低減し、輝度やコントラストなども補正してそのままでは判別できなかったナンバー プレートの文字も判読可能にします。この製品は東京工業大学の研究成果の特許技術を用いているそうです。

東京工業大学 / 奥富・田中研究室 のURL:
http://www.ok.ctrl.titech.ac.jp/index-j.shtml

奥富・田中研究室 / 超解像技術研究に関するページ のURL:
http://www.ok.ctrl.titech.ac.jp/res/CSR/CSR-ja.html

株式会社デジタルデザイン / "捜査支援用画像処理システム イメージレポーター" の製品情報ページのURL:
http://www.d-d.co.jp/imagereporter/index.html


ここで私が思うのは、「月の写真にも複数枚超解像を使いたい」という事です。
AviStack2などの無料のスタッキング ソフトウェアは複数枚の写真の位置合わせと変形と合成を行いますが、ノイズは無くなっても解像度は上がりません。
サブピクセル レベルでのブロック マッチングまでしてくれたら嬉しいのですが、さすがにそこまでは望めませんね。

それともう一つ。このような優れた技術は犯罪捜査などに於いてとても強力ですが、逆に市民のプライヴァシーを侵したり、更には企業スパイなど犯罪に使われてしまう事も懸念されます。技術の使われ方も注意深く見て行く必要があると思います。

- | 次の8件 テクノロジー ブログトップ

この広告は前回の更新から一定期間経過したブログに表示されています。更新すると自動で解除されます。