PEZY

なんかもうこういうタイトルでいいよ…

さて、12月上旬の日本HPC業界をにわかに騒がせているのがこの事件。
PEZY社長逮捕、スパコンの旗手に何が起きたのか

PEZY Computing社の齊藤元章氏が詐欺容疑で逮捕されたというものである。
ここで僕の立場を明らかにしておくと、僕は12/10現在、PEZY Computing社員である。実はSC17のマイナビにも載ったぞ。いぇーい。
まぁあれは頼んで書いてもらった感がありありとするので微妙だが。 Hisa Andoさんありがとうございます!!

というわけで、僕のこの件に関するスタンスは以下。

  • この件の捜査状況、あらゆる疑惑については、その真偽を問わず、基本的にコメントしない
  • NEDO助成金について、事実と反する主張が見られる場合には指摘する
  • 技術的に間違った批判については反論する

である。
今の所それを前提として動いているので、逸脱していることはないと思う。

ところで、なんでこんな風にブログを書いているかというと、こういうのが原因である。

スパコン界『異端児』暗転、詐欺容疑で『PEZY Computing』の社長・斉藤元章容疑者ら逮捕される」
http://blog.goo.ne.jp/narmuqym/e/04536e06db013617fd63ab490159c71f

まぁなんか、またこういうネタかよ、と、半年おきにこういうの書いてる自分のアレさ加減に目を覆いたくなる気がしないでもないが、とりあえず行ってみよう!

齊藤元章素人問題

まぁぶっちゃけた話、社長がどのぐらい技術力あったのか、俺は知らない。
かつて医療系画像処理端末を自分で作っていたという話を聞いたことはあるし、夜な夜なCTとか分解していたのも事実だと聞いている。
(PDP-11で動いてたんだよアレ! とメシを食いながら聞いたことがある)

とはいえ、だ。
PEZY-1, PEZY-SC, PEZY-SC2と三世代のプロセッサを作ってきて、齊藤さんがいまだに第一線で設計しているわけはないし、まして、我が社が誇るハードウェアチームが、素人集団なワケがないことは、改めてここで表明しておきたい。
ウチのチップは、先人たちにも引けを取らない性能を誇るプロセッサであると。
ここで指摘されている(いくつか何言ってんのか全くわからない話があるが…)

命令体形の策定と評価、1ビット問題の最適化、MPUアーキテクチャー上のボトルネックの分析と解消、演算処理データー量及びメモリ転送データー量とのバランス問題、MPUチップ内外のインターコンクション、MUX&DeMUX、データー転送高速化のバッファリング手法の検討、コアの冗長設計とその置換手法、OSのポーティング、コンパイラーの高効率化設計、上位C言語アーキテクチャー&機能記述、マクロ設計及び評価、VLSI機能記述、論理合成検証、不純物分布プロセス・シミュレーションと最適化、物理的マクロ回路設計、回路シミューレーション、チップ上のノイズ伝搬、電源&グランド・バウンシング、スキュー等各種タイミング問題解消、クリティカルパス解消、消費電力による熱的集中の解析と分散化、PLチェッキング、評価チップによるFunctionality及びReliability評価、等など無数の高度で深い仕事がある。

というのは、社内にそれぞれの専門家がいるし、もちろんそれでめちゃくちゃ苦労しているのも横で見てきている。ん?バグが全部出切ったかって? コメントは差し控えますよ。HAHAHA
…まぁOSのポーティングとか、悪夢だったよねえ。やったの俺じゃないけど。
あと、最近のコンパイラっていうのは便利になっててね、LLVMっていうの使うと、一から実装しなくてもよくなるんだ。覚えときなじいさん。
とはいえ、ここは現在のところ、Hotchipsやらなんやら、いわゆる半導体の論文として出ているものがない点というのは心苦しいところでもある。
いずれHotchipsとかに出してほしい、というロビー活動はしていたのだが、まぁいろいろと大人の事情というやつである。ほんとすいません。ありまぁすとかいってます。
ただ、このあたりの数字を詐称して世界4位だの世界1位だのが取れるのだとしたら、我々はあんなに連日終電や徹夜などしていない、とだけお伝えしたい。

あと、なんでこんな

MPUの開発は簡単なものではないことは、IBMのPowerPCに関する論文(電子情報通信学会・特別招待講演論文、大粼勝彦博士発表、Technical Report of IEICE, CPSY94-6, FTS94-6, ICD94-6 (1994-04))に詳しい。

二十年も前のペーパーをわざわざ引用しているのか。もっと新しいのあるだろ。二十年経ったらプロセスルールどれだけ変わると思ってんだ。
http://www.fujitsu.com/downloads/JP/archive/imgjp/jmag/vol63-3/paper04.pdf
とかあるだろ。
…ていうか、なんでMPUとか表記してんの?まぁMicro-processorだから間違いじゃないにせよ、今は全く聞かないなぁ。IBM方言らしいけど。

SC(2)の技術評価の妥当性検証

2017年のスパコンTop500、https://www.top500.org/lists/2017/11/ を例に、スパコンのPMUの性能評価の方法について述べておく。MaxPF値に惑わされてはならぬ。意味が無い。

とりあえず全角数字混ざってる時点で鳥肌立ってやばいのですが、Rmaxには騙されてはいけないらしい。うーむ。RPeakには騙されるなは聞かないでもないが、Rmaxに騙されるなは新説だ。

筆者が着目したスパコンは、NO.3の”Piz Daint - Cray XC50, Xeon E5-2690v3 12C 2.6GHz, Aries interconnect , NVIDIA Tesla P100 , Cray Inc. ”(https://www.top500.org/system/179102)である。MPU群はXeon/Aries/Teslaから成る。その総数は3.65E+5コアである。演算能力は公称19.59PFである。1コア当たりのパフォーマンスを計算する。その値は、MPUの基本演算ユニットの性能を直接的に表現する指標である。順位NO.3のクレイのスパコンはP/C=60GFである。クロック周波数からして、相当に並列同時演算に優れたMPUコアである。

ちょちょっとまってほしい。この段落はツッコミどころが多すぎて、技術的には割と適当なことを言うことに定評のあるぼくちんでも理解に苦しむ。
まず、

1コア当たりのパフォーマンスを計算する。その値は、MPUの基本演算ユニットの性能を直接的に表現する指標である

というのは、2000年代初頭、それこそCell/B.E.(ほんとはその科学技術計算用拡張PowerXCell 8iだが)を主たる演算力として採用した、ロスアラモス国立研究所が擁したRoadrunner以降のTop500においては、もはや意味はない。
だってここ十年のトレンドは、小さなコアを大量に並べて並列処理をして性能を稼ぐ方向にシフトしており、NVIDIA, AMDGPUIntelのKnightsシリーズ(KNHキャンセルになったけどな。ガハハ), PEZYと、全て基本的なアプローチは同様だからだ。

MPU群はXeon/Aries/Teslaから成る

Ariesはインターコネクトなんですけど…MPUの定義が乱れる…

数字の意味に関しては、言っていることがよくわからないので検証しない。そもそもTop500の3.65e5コア数というのの根拠が謎だ。
http://www.cscs.ch/uploads/tx_factsheet/FSPizDaint_2017_EN.pdf
によれば、Piz DaintのHybrid Compute Nodeは5320。それぞれのノードに、12コアのXeonと3584CUDA CoreのP100があるとすると
(12 + 3584) * 5320 = 19130720
だが、そうはなっていない。じゃあSMMの数なのかと思えば
(12 + 3584/32) * 5320 = 659680
そうでもない。
うーむ、わからん。PizDaintの中の人教えてください。

どこをCPUのコア相当としてみるか、そもそもアクセラレータに単純にこの議論を当てはめてよいものか、というのは、この十年一通り議論され尽くして、意味がないという話で落ち着いている(ように見える)。

リストを見て、計算し、直ぐに気付くことは、コア数が1,400万個と途轍もない多さである。「おいおい、何だよ、こりゃ?」

それには俺も同意だが、まぁしょうがないじゃん、命令発行ユニット単位で考えると、SC2ってコア2048(有効なのは1984だが) もあるんだからさ。

P/C=1GFである。PEZY−SC2は700MHzで駆動し、Zeonは1.3GHzで駆動されているが、1コア当たりのパフォーマンスがたったの1GFであるという事は、コア自体の同時実効行効率が他社と比べて非常に低いことを物語る。多重性が殆どない設計だということだ。MIMDを標榜しているが、コアとしてはMIMDになってはいない。

ほぼ毎行ツッコミ入れてないかこれ…なんかだんだん疲れてきたぞ…
まぁ仮に、そのP/Cという指標に意味があるとしてもだ。それはコアあたりのパフォーマンスを意味するのであって、コア自体の同時実行効率という話にはならないだろう。
そもそも多重性ってなんだよ。未定義の言葉を突然なんの脈絡もなく使うなよ。なろう小説かよ。
あと、コアとしてはMIMDになっていない、というが、命令発行ユニットがコアごとに存在していて、それぞれ独立に命令を発行できるという状況であれば、それはMIMDと呼ぶものだろう。他に何と呼べというのか。

PEZY−SC2では、1個当たり64GBのメモリがぶら下がるが、内蔵されているコア数1,984個で除すれば、1コア当たりたったの32MBである。この微小メモリーサイズで、何をやるというのか?

SC2なのかSCなのかはっきりしてくれ…
1コアあたりたったの32MBというが、そもそもとして、各コアがグローバルにアクセスできるメモリ空間をコア数で割ることに何か意味があるのだろうか?
それよりも、1コアに存在する命令キャッシュとデータキャッシュがやたら少ないことと、ローカルメモリが20KBしかなく、うち16KBはデフォルトだと各スレッドのヒープ・スタックで食われることのほうを問題にしてほしい。まぁCUDAのShared Memoryライクに使えるんで、便利なんですけどね。

要するに、単純な回路構成のコアをやたらな数を集積(パターン転写)しただけのMPUである。それを、PEZY Computingは、「メニーコア技術」と自称しているが、コアのアーキテクチャー自体が練られた高度なものではなく、それ自体が素人の発想だ。

NVIDIA「...」(もちろんGPU)
AMD「...」(GPU)
Intel「...」(Knightsシリーズ)
Shenwei「...」(SW26010)
IBM「...」(Cell/B.E.)

今回のキモはここである。
ここ十年、ヘテロジニアスマルチコアというものが研究され、プロセスルールの進捗とともに、良いものも微妙なものもたくさん出てきた。
そのいずれも、基本的な戦略としては、小さなコアを敷き詰めることで行われている。それは、Intelx86, IBMのPOWERのような大艦巨砲主義的なコアは、もはや集積の限界に突入しているというのがあるからだ。
その辺の詳細については、僕よりももっと詳しい人たちがいろいろと話してくれているし、それこそ牧野先生のサイトを見られたほうが絶対に正確な情報が伝わると思うので、そちらを参照してほしい。
とはいえ、その構造がソフトウェアに対して多大な負荷を強いてきたのもまた事実。だからこれは、ムーアの法則末期に咲いた徒花だと思っている。
この人は、そんな愛すべきアーキテクチャたちの何を知っていると言うのか。

いや、多分何も知らんのだろうけど。

あー、すまん、次のパラグラフは普通に頭痛がしたので読むのをやめる。言いたいことが意味不明すぎる。
つまるところ、このセクションは全編に渡って妄想とオカルトが書き連ねられているのである。誰か助けてほしい。割と真剣に。

TCIはオカルトか?

俺が聞きたいよ!!!(切実

という身内ネタはさておき、もともと磁界結合というのは、慶応の黒田先生が研究されているものだ。
http://www.kuroda.elec.keio.ac.jp
それこそ歴史は深く、1980年代ぐらい?90年代ぐらい?から研究されているという。
詳細を把握しているわけではないので簡素に書くけども、これだけ論文が出ていてざまざまな箇所で評価も行われていて、それでもなおオカルトと断じるというのなら、それは数多のレビュアーたちが騙されているということになるし、ジャーナルの権威も失墜する。
つまり、「TCIは、ありまぁす!」

…いかん、これはシャレにならんな。

イスラエルのハイテクベンチャーとは?

さて、長々と書いてきたが、あのブログを書いたのは誰か、というのは、非常に気になるところだ。
ブログのキャプションを参照すれば、

イスラエル・ハイテクベンチャーCEO兼CSの脱&非日本仲間日記
イスラエル情報科学ハイテクベンチャー会社のCEO兼CSの脱日本&非日本仲間10名が発信する日本への警鐘!

だそうである。
あと、このブログは、書き出しのところにIDがふってあり、誰が書いたのかわかるようになっている。
今回の記事では
narmuqym
氏が書かれたそうである。
また、文末にはご丁寧に10名分のプロフィールが記されており、

narmuqym:HP&SUN研究所を経て、米国にハイテクベンチャー設立。最先端ニューラルMPUの研究開発を推進。現在はイスラエルのハイテクベンチャーのチーフサイエンティストに就任。知能の情報処理の根源を研究している。

というキャプションが存在する。
さて、そのうえでいろいろと検索をし(てもらっ)たところ、判明したのは
少なくとも本記事を書いたnarmuqym氏は大崎勝彦博士である、ということである。
また、このハイテクベンチャーというのは、ケレム・サイエンスとケレム・ソリューションズである。
http://www.kerem.co.jp/japanese_index.html
なんていうか目がチカチカする。

ふーん、なんかいろいろ作ってんだなーとか思うものであるが、なんとこのケレム・サイエンスとケレム・ソリューションズ、2013年に経営破綻している。
http://bank-db.com/hasan/867406
http://bank-db.com/hasan/867407

また、現在の米国法人であると思われるNanoProcessor laboratories社だが、カリフォルニア州法人検索ではひっかからなかった。
サンタクララにあるはずなのにも関わらず、である。
https://businesssearch.sos.ca.gov/CBS/SearchResults?SearchType=CORP&SearchCriteria=NanoProcessor+Laboratories&SearchSubType=Keyword

脳内ではメタルギアソリッド2のラストシーン、愛国者達の構成員が100年前に死亡しているというオタコンとスネークの一幕が流れていた…


実用性が云々という話についてはまた今度。というか、ひたすら調べ物してたら無駄に時間を使ってしまった…