最近の話題 2017年4月29日


1.IntelがIDFを安楽死させた

  2017年4月17日のSemiAccuteが,IntelがIDFを安楽死させたと報じています。Intel Developer ForumはIntelの製品や技術を開発者やメディアに情報を伝達して教育する場として開催していたもので,昔は米国だけでしたが,中国やヨーロッパでも開催されるなどより盛んに開催されるようになりました。

  しかし,ここ数年は,技術的に深い情報は出て来なくなり,高い参加費を払ってまで出席する意味があるのかという話が出てくるようになってきていました。

  そして,この度,約20年続いたIDFを止めるというアナウンスが出ました。

  Announcement: IDF17 San Francisco Intel has evolved its event portfolio and decided to retire the IDF program moving forward.

2. JAMSTECがPEZYのスパコンを設置か?

  2017年6月9日付のJAMSTECの職員の公募情報にPEZYのスパコンの粒子計算コードの開発を行う特任技術研究員あるいはポスドク研究員の募集が掲載されています。JAMSTEC(海洋開発研究機構)は,かつてTop500世界一となった地球シミュレータが設置されていた研究機関です。

  なぜ,6月09日付けのページが4月下旬に公開されるのかは分かりません。しかし,研究者を公募するというのですから,JAMSTECにPEZYのスパコンが設置されることになることは確かなようです。

  なお,本公募では,男女平等の理念のもと,女性の社会進出を推進するという日本政府の方針に準拠して,多数の女性の積極的な応募を期待するとともに,男性候補者と女性候補者の業績および人物評価が同等であった場合は,女性を優先して採用します。と付記されています。

  実質的には差別されている女性にはありがたい方針です。女性の方は奮って応募下さい。

  とは言え,採用期間は今年の10月1日から来年の3月31日の半年間で,派遣労働者より厳しい雇用です。これは男女ともに同じですが,なんとか,もっと生活が安定するような雇用形態がとれないものでしょうか?

  平成31年度のプロジェクト終了まで雇用される可能性が高いとはいえ,博士号を持った研究者がアルバイトより短い半年の雇用契約というのは悲しいです。またポスドクで,給料は525万円/年で昇給,賞与なしです。

3. WaymoがPhoenixで,自動運転タクシーの会員を募集

  2017年4月25日のThe Inquirerが,Googleの自動運転の開発部門であるWaymoが,アリゾナ州の州都のフェニックス エリアで自動運転タクシーの大規模なテストを開始し,利用する会員を募集すると報じています。

  Waymoは,ここ数か月,フェニックスで100台規模で自動運転車を走らせてきた(先ごろ,左折する車にぶつかられて横転事故を起こしましたが)のですが,500台,自動運転車両を追加し,利用したい一般人の会員を募ると報じています。

  この会員は,たまに利用する人ではなく,毎日利用するというようなユーザを集め,どのような使い方がされるのかなどに関する情報を集めるとのことです。

  車は,Lexus RX450hとクライスラーのPacificaミニバンだそうです。この実験では人間のエンジニアは乗っていますが,本当に危険な場合だけしか手を出さないことになっています。

  Googleは,自動運転車に乗るエンジニアに,最低賃金の倍くらいの給料を払っていますから,それで500人の雇用は,かなり費用がかかります。また,同乗のエンジニアは,殆ど手出しの必要は無いでしょうから,もっとも達成感の無い仕事ではないかという気がします。

4.Wave ComputingがDataflow Computing Unitを発表

  2017年4月26日のTop500ニュースが,Wave Computing社のDNNのアプライアンスの発表を報じています。

  同社は,昨年の7月まではステルスモードで活動しており,その後も,詳しい内容を発表していませんでしたが,このほど,アーリーアクセスでの提供を開始しており,今年4Qには製品を出すと発表しました。

  同社は非同期処理を行うDetaflow Processing Unitというニューラルネット向けの処理を行うLSIを開発しています。DNNアプライアンスは,3Uの筐体に16個のDPUと128GBのHybrid Memory Cube 3D積層DRAMを搭載し,さら2TBのメインメモリと16TBのSSDを搭載しています。

  このボックス1個で2.9POps/sの演算性能で,最大4台結合して64DPUで11.6POps/sのシステムとすることができます。

  多分8bit整数のAI演算性能は2.9POpsとのことです。これはDPU 1個あたりでは181.25POpsであり,NVIDIAのP40が47Tops(8bit整数演算)であるのと比較すると,3.86倍の演算性能です。また,GoogleのTPUと比較しても約2倍の演算性能です。

   同社は,coarse grained reconfigurable array (CGRA) というアーキテクチャを使っており, 16個のPEと8個の演算ユニットをまとめたものがcoarse grainとなっています。そしてDPUチップは1024個のグレインを集積しています。

  そして,PE内部は実質的には6.7GHzのローカルクロックで動いています。アリスメティックユニットは最大6.7GHzで演算ができるようです。つまり,1個の8bit演算器は13.4GOps/sで,算術ユニットはこれが2個で26.8GOps/s。チップ全体では8192算術ユニットで219.5GOps/sという計算になります。これがなぜ181.25POps/sになっているのかは分かりませんが,何か空きサイクルが入ることになっているようです。(この部分,修正しました。)

  最初は,隣接したPEからの2つのデータを演算し,チップ内ネットワークを経由したり,メモリから読み出す3番目のデータは,後で処理するというやり方で,1つの演算器を2回使って性能を稼いでいます。

5. xSIGで富士通が低電力のDNN回路を発表

  2017年4月25日の日経テクノロジーonlineが,第1回のxSIGでの富士通研究所の発表について報じています。ニューラルネットの計算は,それほど数値の精度が高くなくともよいと言われていますが,すべての計算が低精度で良いとは言えません。

  富士通研究所の方式では,32ビットの浮動小数点数のデータを8ビットや16ビットの数に変換して計算を行い,計算に必要な電力を減らすのですが,GoogleのTPUのように,8ビット決め打ちというのではなく,計算処理中に演算器の出力データを解析して,その結果をデータベースに蓄積して判断して,できるだけ計算精度を低下させないようにアダプティブに演算設定を変更していきます。

  演算設定ですが,例えば16ビット固定小数点数で計算する場合,データ解析部からのフィードバックに基づいて小数点の位置をスライドして,16ビットの数値表現から溢れるデータが無くなるように制御します。 
  LeNetの場合,32ビット浮動小数点で計算した場合の認識率は98.9%であったのに対して,提案の居方式を使って16ビット整数で計算を行った場合の認識率は98.89%,8ビット整数で計算した場合は98.31%になったとのことです。

  LeNetは手書き数字認識の,小さなネットですが,それでもかなりの数の演算器があります。その中でどの演算器の出力を解析するのか,どこの位置で小数点の位置をずらせてスケーリングを行うのか,小数点の位置のことなる2つの数を足す場合,小数点位置を合わせる回路が必要になりますが,この回路のチップ面積,消費電力のオーバヘッドが気になりますが,日経テクノロジーの記事では,それらは書かれていません。発表があったのかどうかも不明です。