R. Shioya Profile
R. Shioya

@r_shioya

1,630
Followers
92
Following
299
Media
4,597
Statuses

コンピュータの研究をしています

ほんごー
Joined June 2018
Don't wanna be here? Send us removal request.
Pinned Tweet
@r_shioya
R. Shioya
6 months
東京大学 情報理工学系研究科 創造情報学専攻の塩谷研では修士や博士の学生さんを募集しています(願書申込〆は6月始めと11月中旬の2回) 塩谷研では CPU や GPU などをのハードや,ハード寄りの基盤ソフトウェア(言語処理系など),ファジングやセキュリティなどを主に研究しています(以下続
1
21
73
@r_shioya
R. Shioya
2 years
むかし指導教員の先生が,「慣れた環境や言語に固執するのは老化の始まりなので,たとえ使いにくく出来が悪かろうと俺は新しいものに定期的に乗り換える」と言いながら良く地雷を踏みに行っていたけど,あの精神は大事だよなと思うしたまに思い出すな
3
3K
10K
@r_shioya
R. Shioya
2 years
飛行機の席で映画とか見れるやつ、各座席に動画データ配るのって帯域とかエグくないか?と思ってたんだけど、開発者の人に聞いたら大量の耐熱イーサネットケーブルが機内中央サーバーから各座席まで走っててこれが超重いので実際問題になってるそうな
22
2K
8K
@r_shioya
R. Shioya
5 years
わかったことをまとめると, ・日本人の研究不正件数や論文撤回数はアメリカや中国の数分の1ぐらいぽい ・研究者人数比あたりで考えると,むしろドイツが結構やばげ ・数人の日本人研究不正ガチ勢が凄い数の論文撤回を出してる ・なので,撤回数ランキング上位のシェアだけ見ると日本人が多く見える
9
3K
5K
@r_shioya
R. Shioya
14 days
ひっそり作って自分で使ってたファイルサイズの可視化ツール,これがそのまま回路サイズの可視化に使える事を後輩が発明してめっちゃ役に立つので回路用の HTML 版を作っていたのだけど,大体動くようになってきた
18
396
2K
@r_shioya
R. Shioya
3 years
ハードウェアのテスト(ファジング)をテーマに修論を書いてる学生さんの研究が進んだ結果,研究室で作っている CPU の未発見のエグいバグがきちんと発見されてしまったようで,本人は嬉しそうだし喜ばしいけどツラい
1
220
1K
@r_shioya
R. Shioya
7 months
これさらにテストファイルを意図的に壊して展開不能にした上で「bad-3-corrupt_lzma2.xz」と名前をつけて,いかにも正常じゃない壊れたファイルのテスト用ですよとみせかけた上で,テキスト置換で展開可能に復元してから展開するという三段構えな気がする
Tweet media one
@izutorishima
Torishima / INTP
7 months
これさらに巧妙なのが、GitHub のコードにはバックドアを混入させるコード自体は仕込まれておらず公式サイトの tarball にしか入ってなかった上に、肝心のバックドアは liblzma が圧縮ライブラリなのを悪用してテストファイルとして Git に忍び込ませてた二段構えになってること
1
413
766
1
492
970
@r_shioya
R. Shioya
2 years
プログラミング言語とかで, 「人は見慣れないものを嫌うので,新しい概念が普及するには時間がかかる」 「でも WEB 界隈は,『とにかく新しいものこそ格好いい』的な文化があるので,短時間で新しい概念が入りやすい」 と言う話を最近していたのだけど,なんか通じるところがあるきがする
2
285
949
@r_shioya
R. Shioya
2 years
半導体の国際ロードマップ IRDS の文章で,「~nm とかのテクノロジノードは数字を良く見せるために色々定義が変わってきたんやけど,最終的には物理的な大きさとは全く関係なくとにかく前の世代の数字を 0.7 倍したものになったで」的にぶっちゃけられてて,なかなかひどい
Tweet media one
1
534
912
@r_shioya
R. Shioya
2 months
ハッシュ表で2^64 bitとかで得たハッシュ値からバケットのIDを得る時,2^64を黄金比で割ったものを乗算してやると,植物が茎の周りに黄金角で葉っぱを生やして重なりにくいのと同じ理屈で連番の数字がよく散るらしく,Linux カーネルでも使われてるみたいで面白かった
1
251
854
@r_shioya
R. Shioya
5 months
むかし git を使い始めたときは相当混乱したのだけど,当時友達から「あれは歴史ではなくツリー状のデータ構造だと思った方がよくて,ブランチはノードについているラベルだと思った方がよい」と言われて,これでかなりわかった記憶がある
1
146
697
@r_shioya
R. Shioya
3 years
学生さんが React で課題作ってて,「やたら色々ややこしいし何が良いのかわからない.jQuery ならもっと簡単なのに」みたいなこと言ってて,何年か前にこの記事みて笑ってたときと状況が同じだった.
1
267
636
@r_shioya
R. Shioya
5 months
ハイパースレッディングを無くしたの,より性能を上げるみたいな前向き理由じゃなくて,複数スレッドでハードを共有すると どうしてもそこへの副作用を通じたコバートチャネル的な脆弱性が原理的に出来てしまうので,もう対策を諦めたあたりが本音なのではと言う気がする
1
308
603
@r_shioya
R. Shioya
3 years
RISC-V の gcc でめっちゃでかい関数内でジャンプすると飛び先が即値で表せる範囲に収まらなくてコードが壊れるヤツ,issue 投げてみたら既知の問題であったらしい.放置していたと言うよりは,解決が簡単ではないのと,マンパワーが足りないので優先されていないとのことだった.
2
185
580
@r_shioya
R. Shioya
8 months
色々調べ物してて思ったんだけど,古くからなんだかんだ IBM や Intel, AMD, ARM とかは論文書いて知見を共有してて,Google や MS, Meta も名前をみるけど,Apple だけは本当に1度も論文で見ない一方で特許はひたすら取ってるんだなと
1
143
550
@r_shioya
R. Shioya
2 years
ゲーム機の互換性だと,スーファミはファミコンに対して, ・CPU は上位互換 ・メモリマップ IO のアドレスが被らないように避けてある(被ってるところは全く同じ機能になってる) ・グラフィックのタイルのフォーマットも互換性がある とかで,真面目に互換性が検討されてた雰囲気があった
5
111
451
@r_shioya
R. Shioya
4 years
Apple も MS も署名なし野良バイナリは弾く方向で,いや何を走らしても安全な OS 作ってくれよと思ったけど,一方ブラウザは何でも開けば実行できる上にファイルから USB,ソケットとかまで API あって WEB Assembly までくると,これがその安全な OS ってやつよって感じにみえてくるな
5
125
429
@r_shioya
R. Shioya
5 months
C 言語で書いた数行のプログラムをオリジナルのアセンブリ言語に変換する課題で,なぜか x86 で書かれててご丁寧に最後に int 0x80 で exit のシステムコールまで呼んでるものが提出されてきて,まぁ言語を指定されなかったのでとりあえず x86 で書いたのかな ChatGPT 先生も大変だなとなった
3
103
434
@r_shioya
R. Shioya
2 years
暗号や秘密計算方面の方によると x86 に AES 暗号専用命令が入ったのは業界的にかなりでかかったそうで,あれのおかげで乱数生成がめっちゃ速くなったり,色んな問題を AES に落とし込めば超スピードで処理できるようになったりで研究がグッと進んだのだ・・・ とおっしゃっていて,なるほどなぁと
1
126
414
@r_shioya
R. Shioya
3 years
Linux でコアごとの周波数を見る方法をぐぐったら cpuinfo を定期的に cat するという身も蓋もない方法がでてきて,でもこれが一番みやすかった $ watch -n1 "cat /proc/cpuinfo | grep MHz"
1
69
405
@r_shioya
R. Shioya
9 months
「なぜキャッシュメモリは速いのか」だけど,これ良い質問だよね.つきつめるとたぶん情報を記憶するには物理的な実体がいるとか情報を伝達するには距離に応じた時間がかかるとかあるいは人間は同時に複数の事をあまり考えられないとかに行き着くと思うんだけどこれは考えるt(急に早口になるオタク
1
81
369
@r_shioya
R. Shioya
4 years
今まで CPU の研究をしているというと, 「実際に作ったりするんですかー?」とか聞かれることはよくあり, 「いや,理論を考えてシミュレータで評価する感じですねー」って答えてたのが, 「あー,実際作ることもありますネ」って言えるようになったのでちょっと嬉しいな
2
46
355
@r_shioya
R. Shioya
4 years
ここで書かれてるようなオンラインで横や縦の繋がりが作れなかったり雑談出来ないのは本当やばいよねって話を学生さん達としてて,これは既に関係や方針が作れてた今年の修士卒とかでは表面化しないけど,今年度入進学して最初からオンラインだった人達には遅行性の毒的にきいてくるんじゃないかなと
@takumiwish
牛乳
4 years
近況報告: D進しないことにしました #note (色んな方にお世話になったにもかかわらず) 進路報告がめちゃくちゃ遅くなってしまいごめんなさい…… 進路を決めた経緯について書いたので、興味ある方は読んで頂けると嬉しいです
0
35
187
1
84
347
@r_shioya
R. Shioya
7 months
これは気になって中の人に聞いた事あるのだけど,命令セット自体の差は実際そこまで影響はないはずで,どちらかと言えば対象マーケットの違いもあって x86 の方が高周波数出すために回路的に無茶しまくってるから効率悪いと言う話だった.
@telmin_orca
山田てるみ
7 months
(そもそもArmが電力効率がいいとか言ってる人は……………) ARMはx86より効率がいいというのは過去の神話
1
213
456
2
132
333
@r_shioya
R. Shioya
2 years
このインタビューの途中なんかでも書かれているように,PS2 の PS1 互換機能は PS1 の CPU を丸ごとハードとして内蔵しつつ PS2 の IO プロセッサとしても使うみたいなある意味荒技で作られてたので,そもそもエミュレータではなかったかも
0
117
307
@r_shioya
R. Shioya
5 years
cold boot attack ていう、DRAM のデータが消えるのに少し時間がかかるのを利用してメモリを無理矢理他のマシンに差し替えてデータを盗む方法があるんだけど、このロマサガ2のやつはその実例として非常に良かったので今日の講義で取り上げて解説してきた
1
212
282
@r_shioya
R. Shioya
4 years
65mm で製造してた RSD()のチップが届いたので、マイ CPU(物理)を作る実績が解除されました
Tweet media one
4
98
284
@r_shioya
R. Shioya
2 years
RISC-V のベクトル拡張はかなりダメな仕様だと思ってて,実際に作ってる人には割とその意識は共有されてる気がするものの,もう業界全体がこれで行くんだみたいな方向に舵切って勢いがついてしまってる感があって,これは盛大な負の遺産になるのではという気がする
2
93
273
@r_shioya
R. Shioya
7 months
xz に backdoor てそりゃ穏やかじゃないですねと思って見に行ったら, ・tarball 内の configure に難読化されたスクリプトが挿入されていてビルドプロセスを変更する ・liblzma として openssh に組み込まれて起動されると色々情報を拾い上げる てことなのかな.おそろしや
1
109
274
@r_shioya
R. Shioya
4 years
インテルからの賞金の受け取り方で揉めに揉めて(どうもコンプラの関係で個人にはお金を直接送金できないらしい),けっきょく研究室への研究寄付金の形で受け取ることになったのだけど,おかげで「うち,インテルからも出資を受けて CPU の研究してるんですよ(嘘ではない)」とかいえるようになった
0
54
261
@r_shioya
R. Shioya
2 years
@taichi600730 全員が違う動画を一斉に見始めるとかすると流石に辛い気はしますね。各座席に予め wifi で配っとくならありな気もしますけど、それとは別に運行情報とかはリアルタイムで配らないと行けないですし一筋縄ではいかなさげですかね
1
26
255
@r_shioya
R. Shioya
5 years
富士通の A64FX の資料,かなりガッツリとマイクロアーキの中身を書いてくれてていいな.OoO スーパスカラのものでここまできちんと詳しいやつは Alpha のマニュアルぐらいしか見たことないかも.
Tweet media one
Tweet media two
Tweet media three
Tweet media four
1
111
258
@r_shioya
R. Shioya
3 years
主に CPU のシングルスレッド性能を示す SPEC CPU 2017 int speed のランキング,ちょっと前まで Zen3 世代の AMD EPYC がトップを独占してたのだけど,この 10月ぐらいから最近出た Rocket Lake 世代の Intel Xeon がかなりの差を付けて取り返してて,いいぞもっとけんかすればいいんだ感
Tweet media one
3
107
245
@r_shioya
R. Shioya
3 months
FB のデータセンター内のSSDを分析した論文だと,最初に高故障率の山が一度来た後に書き込み量に比例して壊れる感じらしく,故障が書き込み回数に比例するとして何回目で壊れるかはチップ毎に製造バラツキが結構あるからかもと言われてて,この壊れ方ならRAIDの意味があるかも
Tweet media one
@tetsutalow
上原 哲太郎/Tetsu. Uehara
3 months
それにしても冗長性目的でSSDをRAIDにするのやめた方がいい。機械的に確率的に壊れるHDDと違って、SSDは同一セルの書き込み回数に起因する劣化が故障の最大要因。あとウェアレベリングが複雑かつ各社競争してるのでファームのバグも多い。それをRAIDにすると同時に壊れるダブルフォールトが増える。
2
110
192
1
141
250
@r_shioya
R. Shioya
5 months
ここにまとまってる情報が正しければ,Apple M4 の命令ウィンドウというか ROB サイズは 900 命令超えてて発行幅も20命令ぐらいあるし,もう来年にでも 1K 命令のウィンドウのマシンが出てきそうな
Tweet media one
2
94
246
@r_shioya
R. Shioya
2 years
この arm に追加された memcpy 専用命令がなんで前処理/本処理/後処理の3命令に分かれているのかと言う話,色々コメントもらったりして考えてるうちに,なんとなくこう言う理由じゃないかなと思ったのでもっかいまとめてみようと思う
@r_shioya
R. Shioya
2 years
arm に memcpy/memset 専用の命令が追加されてたみたいで,動機はわかるのだけど,なんでまったく同じオペランドをとる3つ組の命令になっているのかの意図がよくわかんないなこれ.たぶん途中で例外起きたときとかの対応のためだとは思うんだけど.
Tweet media one
Tweet media two
3
27
93
1
98
245
@r_shioya
R. Shioya
2 years
if と switch が適当に入って分岐予測ミスがガンガン起きるループを分岐にならなさそうなコードに書き換える実験やってたら,gcc の -O3 だと何も指定しなくてもゴリゴリに SIMD 命令使ったコードにコンパイルされてて一桁近く速くなってちょっとビックリだった
Tweet media one
Tweet media two
0
74
243
@r_shioya
R. Shioya
2 years
みんな大概知ってるけど,でも「あの半導体の~nmとか言ってる数字,あれ今はモデルナンバー的になってて,もう物理的なサイズとはあんま関係ないんすよね」みたいな説明をする事はたまにあって,当然メーカーはそうは直接言わんので,こういうある種の公的な文章で言ってくれると引用できてありがたい
1
118
227
@r_shioya
R. Shioya
2 years
「配線の間隔を基準にした昔の定義でいえば今は 18nm ぐらいの世代に入ったところやし(まだ本当はそこまで小さくなってないしと言うニュアンス?),やれる事まだ結構あるんで,次の10年もムーアの法則は続くんちゃうかな」みたいなこと書いてあるね
Tweet media one
2
147
211
@r_shioya
R. Shioya
1 year
2ページ目あたりにある,タクティクスオウガのエレメントのシンボルがなんであの形なのかと言う話,要はスーファミの機能からきてるのだけど,たぶんここに書いてある事だけでは普通は良くわからないと思うので,かなり誰得だけどもう少し解説してみる
Tweet media one
@denfaminicogame
電ファミニコゲーマー
1 year
『タクティクスオウガ』のマップはなぜ、圧倒的なクオリティと規格外のボリュームを両立できたのか? その背景には業界最古のゲームエンジン「HERMIT」の存在があった 未来を先取りしたオーパーツ的な発想と、最先端を走る技術者のスゴ技から生まれた名作の舞台裏に迫る
Tweet media one
5
1K
2K
1
83
207
@r_shioya
R. Shioya
11 months
いま日本で売ってる電子タバコに使われているコントローラは大概もう RISC-V だという噂を聞いて,しかし特に探してもそれらしいソースがないなと思ってたんだけど,なんかそれっぽい事が書かれてた
2
63
203
@r_shioya
R. Shioya
1 year
キャッシュの考え方を講義で教えたら,「アプリでキャッシュが溜まると遅くなったりキャッシュの削除で不具合が解決したりするので,キャッシュとはなにか悪いものだと思ってましたが必要なものだったんですね」的な感想がきて,確かに目にする状況考えると悪い印象もちそうだよなと
1
86
201
@r_shioya
R. Shioya
4 months
PFN ��戻って助けてくれんかと声かけてめっちゃ酒飲んだりしていい方向に進んだのだけど、しかし冷静に考えると高校の部活の先輩から久しぶりに連絡きて用件もなしに「飯でも食わへん?」て、普通はマルチか新興宗教で行ったらあかんやつだよな
3
14
202
@r_shioya
R. Shioya
5 years
どうも下のランキング見ると日本人らしきものは1位183本,3位59本,5位51本とかで,要するに日本人上位ランカー数人が世界シェアを占めるぐらいマジやばいってだけで,全体に不正する人が多いかって言うと別にそんなことないんでねと
1
249
190
@r_shioya
R. Shioya
3 years
学生さんが「load reserved とかアトミックとか良くわかんないのが出てくるんですよね・・・」とか言ってきたので,そんなあなたのためにこの号の原稿を書きましたと渡してきた役にたったよかった(ステマ
@CQ_connect
CQ出版社【公式】📚
3 years
【発売中の最新号】 Interface 2021年11月号 特集 マルチコア時代の並列プログラミング ~CPU遊ばせておくのはもったいない~ B5判 272ページ 特別号定価1,130円(税込) ▽詳細はこちら
Tweet media one
0
7
50
2
46
193
@r_shioya
R. Shioya
5 years
RISC-V の仕様書が更新されてたので眺めてたのだけど,各部分の仕様が凍結されている状態を示すはずだった「frozen」の上位?に「ratified」が導入されてて,「凍結する・・・!するが・・・ 溶けないとは言っていない・・・そのことをどうか諸君らも思い出していただきたい」みたいになっとる
1
104
183
@r_shioya
R. Shioya
5 years
とある方が SystemVerilog のパーサとそれを使ったリンタを作っていたので,「VSCode でリアルタイムで使えると嬉しいんですけどねー」とか言ってたら光の速さで本当につくれって嬉しい.ていうか凄い.
1
68
178
@r_shioya
R. Shioya
3 years
記事では触れられていないけど Itanium がぽしゃった大きな要因としてそもそも「VLIW の方がスーパスカラよりも性能がでると思ってたけど,そうはならんかった」と言うのがあると思うんよね.
@asciijpeditors
ASCII.jp
3 years
CPU黒歴史 周回遅れの製品を20年に渡って供給したItanium
2
121
242
1
65
179
@r_shioya
R. Shioya
5 years
下のJST の資料の図2とかみると,特に日本の研究不正が多いってこともなく,順当にアメリカと中国のが多そうにみえる.てか意外なのは,人数比だとむしろドイツが結構多そうだなとか.
@kemohure
kemofure
5 years
日本の研究不正は世界的に見てもダントツに多くて、世界中から『日本の研究倫理はどうなっているんだ』って見られているので、今回の存在しない神学者とその論文をでっちあげた上に、盗用パッチワークで学術書を出す問題も、ほんと笑いごとじゃないんですよね。日本では倫理教育がなされていない問題
16
2K
3K
2
231
162
@r_shioya
R. Shioya
5 years
東京大学 塩谷研究室では修士・博士(社会人含む)の学生を募集しています.コンピュータのハードウェア,特に CPU のアーキテクチャを中心に研究していますが,その他にも OS や言語処理系など低レイヤ全般を含めて興味がある方は,ぜひ受験をご検討ください!
2
72
163
@r_shioya
R. Shioya
3 years
RISC-V はどこが良いのですか? という話だったのだけど、技術的なことではなくて個人的には、インテルとか ARM じゃなくてもみんなプロセッサ作っても良いんだよと言う空気に世界中をしてくれた点がいちばん良かったなぁと思います
1
43
164
@r_shioya
R. Shioya
5 years
これも適当にぐぐって出てきたデータだけど,retraction watch ってところがまとめた撤回数の一覧だと,やっぱりアメリカと中国がダントツよね
@kemohure
kemofure
5 years
データ的には、2016年2月の時点の調べで、研究不正による撤回論文数、1位から12位までの685件のうち、日本人研究者が行った不正論文数は251件、論文総数から見ると日本が圧倒的ダントツのシェア。このデータはジル・アルプティアン「疑惑の科学者たち」より。
2
697
638
2
205
154
@r_shioya
R. Shioya
5 months
もともと大学教員を任期制にしていったのは流動性を高めて競争を促すとかなんかそんな理由だった気がするけど,きちんと流動性が高まった結果,任期とか別にない上に給料もずっと高い民間にみんな移っていった気はする
1
39
152
@r_shioya
R. Shioya
7 months
アクセラレータが発展するとアムダールの法則が言うように並列化できない汎用コンピューティング部分が残ってコストや能力で支配的になってしまうので CPU も頑張りますわ的な,よくうちで出す論文のイントロに書いてる話まんまのがモチベとして書いてあった
@telmin_orca
山田てるみ
7 months
Introducing Google Axion Processors, our new Arm-based CPUs @googlecloud おおーーいいね!サーバー用にもGoogleが出してきたかぁ
0
9
33
0
52
151
@r_shioya
R. Shioya
3 years
少し前に回路とシステムワークショップで RISC-V について話したスライドです.RISC-V については目新しい内容は無いと思いますが,大学や企業での使用例に興味ある方には参考になるかもです.後半に PEZY Computing さんとティアフォーさんでの使用事例もあります(宣伝).
1
55
141
@r_shioya
R. Shioya
5 months
ここの説明だと,スレッド間のフェアネスを保つためのスケジューラとか,脆弱性対策のために追加でゴチャゴチャつけてた回路がハイパースレッディングなくすといらなくなったと言う説明で,たぶんこっちのがありそうだなと思う
1
69
139
@r_shioya
R. Shioya
3 months
研究のお手伝いで,自作 CPU の脆弱性を突いて情報を漏らす攻撃をしているのだけど,自宅に泥棒に入るみたいな気分だなこれ
1
11
139
@r_shioya
R. Shioya
3 years
こちら,CPU コアのベースにはうちで開発している RSD が使われています.RSD は色々構成を変えられるのですが,そんなでかいパラメータでまじで動くんだって感じに盛り盛りに強化されていたと思います.予備評価ではかなり高い性能が出ていたらしいので,いろいろ楽しみ.
@HidetsuguIRIE
入江 英嗣
3 years
研究室で開発中の新CPUアーキテクチャ"STRAIGHT"による,初の高性能実装(OoO)チップが届きました. 実証チップながら,独自命令セットの強みを生かして,最新の高性能CPUを凌駕するフロントエンド幅を備えています. TSMC 28nmプロセスによる実装です.
Tweet media one
1
152
699
0
53
135
@r_shioya
R. Shioya
1 year
講義で論理回路の実現方法を説明するときにいきなり CMOS の話をしてもわからんよなと思ってたけど,まず電磁石で ON/OFF できるスイッチというかリレーを導入して,なぜか G/S/D の三端子がある N型/P型 リレーを作って,ひとしきり説明したあとに CMOS に置き換えるとなんか通りがよくなった
Tweet media one
Tweet media two
Tweet media three
Tweet media four
1
55
134
@r_shioya
R. Shioya
4 years
東京大学 塩谷研究室では修士や博士の学生さんを募集しています.コンピュータのハードウェアの中でも CPU のアーキテクチャを中心に研究していますが,その他にも OS や言語処理系など低レイヤなあたり全般を含めて興味がある方は,ぜひ受験をご検討ください!
2
34
127
@r_shioya
R. Shioya
5 years
表はこれ.世界的に凄い勢いで撤回数増えてるのはそうなんだな.
Tweet media one
2
155
115
@r_shioya
R. Shioya
7 months
これ感慨深いのは,もう結構前だけど 2000 年代中後半あたりはマルチコアとかアクセラレータがこれから重要で CPU コアはやっても意味ないでしょみたいな事を,国内外関係なく査読者とか,えらい人がこう言うグラフ出しながらよく言ってきてて,
Tweet media one
@r_shioya
R. Shioya
7 months
アクセラレータが発展するとアムダールの法則が言うように並列化できない汎用コンピューティング部分が残ってコストや能力で支配的になってしまうので CPU も頑張りますわ的な,よくうちで出す論文のイントロに書いてる話まんまのがモチベとして書いてあった
0
52
151
1
29
117
@r_shioya
R. Shioya
3 years
あと,「RISC-V GNU toolchain developers がマジで足りてないのよ」,と言われて,結構たくさんの人がアクティブにやってるんだと勝手に思ってたのでスイマセンという感じだった.
0
31
113
@r_shioya
R. Shioya
2 years
@toyoshim @taichi600730 今どきだと可能だと思いますし考えてるとは思うんですけど,駐機時間だけで映画10本単位でデータの更新かけたりとか,壊れたときの故障端末の特定をきちんとやれるようにとか,航空機の機体安全認証のときにバキバキに電波飛ばすシステムの証明とるの大変そうとか,実用化は結構たいへんそうだなぁとか
1
10
107
@r_shioya
R. Shioya
2 years
むすこが、ぶじに、うまれた!
19
1
110
@r_shioya
R. Shioya
2 years
この時はスーファミ版をさらにXBOXにエミュレータ使って移植する仕事で,元のソースいらんけどなと思ってたら,報告されたバグがエミュレータ由来じゃない事を示すためにスーファミ実機でプレイしてバグを再現させるはめになって(とてもムズい),その時ソース見て検証用無敵化裏技を見つけて助かった
0
20
100
@r_shioya
R. Shioya
1 year
コンピュータアーキテクチャに関するトップ会議の MICRO で我々の研究の発表があります.論文はこちらで,効率的な out-of-order 実行をレジスタリネームなしに可能とする新しい ISA の話です.発表は 10/30 朝1のベストペーパーセッションです.
2
39
103
@r_shioya
R. Shioya
7 months
あとはリンク先で触れられてない点として ・デコーダが支配的でないのはそうだけど,見ての通りL1キャッシュ並か以上にデカくて依然として影響はある ・x86 が酷すぎるだけで arm のデコードも別に簡単ではない ・arm も x86 も今時はデコード済み命令をキャッシュするので電力への影響は小さい とか
1
33
100
@r_shioya
R. Shioya
5 years
というわけで,長年作ってたスーパスカラ・プロセッサ RSD を,本日開催中の FPGA に関する国際会議 FPT での発表に合わせて公開することとなりました.
0
57
100
@r_shioya
R. Shioya
4 years
なんかこの「東大首席」ってたまに見るしググっても名乗ってる人いるけど,システム上そう言う名前のものもないし,後期は組織間で点数付けシステムも違うから1番って決められない上にあったとしても順位は本人にはわからないと思うんだけど,具体的になにのことなのか気になる.
@mon_nu13
もんぬ|ご自愛の追究
4 years
東大主席の友人をすごいすごい褒めまくってたら 「僕の得意な『勉強』がたまたま皆やらなきゃいけないものだっただけで、例えば君の得意な『コミュニケーション』が必須科目だったら僕は劣等生だよ。」 と言われたことが忘れられない。 人を上下や勝ち負けで捉えないピュアな自信が最高に尊くない??
200
46K
325K
6
19
96
@r_shioya
R. Shioya
2 years
arm に memcpy/memset 専用の命令が追加されてたみたいで,動機はわかるのだけど,なんでまったく同じオペランドをとる3つ組の命令になっているのかの意図がよくわかんないなこれ.たぶん途中で例外起きたときとかの対応のためだとは思うんだけど.
Tweet media one
Tweet media two
3
27
93
@r_shioya
R. Shioya
2 years
とあるファミコンのゲームをスーファミに移植したもののソースコードを見たことがあるんだけど,アセンブリ言語で書かれたゲームのコア部分はファミコン版のをほぼそのまま使い回して再アセンブルされてて,そりゃ移植は結構楽だよなと思ったことがあったり
1
19
89
@r_shioya
R. Shioya
7 months
いや,good-large_compressed.lzma を展開して得られたバイナリに対して head とか tr で間を抜き出したり置換したものを更にもう一回 xz 展開すると真の攻撃スクリプトになるのかな.すごいな.
0
41
89
@r_shioya
R. Shioya
4 years
測定をお願いしていた企業さんから,実チップで無事 CoreMark が正常実行できた報告がきました.
@r_shioya
R. Shioya
4 years
65mm で製造してた RSD()のチップが届いたので、マイ CPU(物理)を作る実績が解除されました
Tweet media one
4
98
284
3
27
86
@r_shioya
R. Shioya
5 years
これよく言われるけど,実際は Sandy Bridge 以降とそれ以前は,Pen 4 と Pen III ぐらいはマイクロアーキテクチャ違ってて(OoO スーパスカラとしての基本的なデータパスが全然違う),インテルがそこを別にマーケ的に強調する気なかったからあんま知られてないよなって感じが
@sonic88510
そにっく@ひのわ
5 years
ついでに言うならこのintel Core i9-9900Kに限らず、現在intelから販売されているあらゆるCPUは 1995年発売のPentium ProのP6アーキテクチャを継ぎ足し改良し続けて24年かけて熟成された品になります まあ現状からすると明らかにに腐敗してますけど。
1
55
86
0
42
91
@r_shioya
R. Shioya
6 months
QEMU 9.0 より Plugin が拡張されてレジスタ値の取得ができるようになりました(うちの学生の小田喜くんが頑張ってコミットしてくれました.ありがたや シミュレータ等の入力に使う実行トレースをお手軽にとれるようになりますので,そう言う事やりたい人はぜひお試しください
1
20
91
@r_shioya
R. Shioya
11 months
rep movsd とか遥か古代から色々工夫されてたよなと思って探したら,stack overflow に元インテルの人?が現れて説明してた Pentium Pro のころは,通常のコードからは使用できないデータパスやコヒーレンスプロトコルを裏で使って実装してたのでマジで速かったそうな
1
42
88
@r_shioya
R. Shioya
5 months
なんかオリジナルの命令セットとアセンブリ言語の定義ごと食わして課題やらせてみたら概ね正解出してくるんだけど,これ提出者の頭がもう少し回ればどうにかなってしまっていたかもしれないのか・・・
0
21
88
@r_shioya
R. Shioya
5 years
グラフはこれですな.それぞれ申し立て件数や認定数がばらばらなのはあるけど,でもやっぱり日本がダントツに多いってことはないんでないかなぁ
Tweet media one
1
103
85
@r_shioya
R. Shioya
4 years
今週は学生さんと色んな ISA のトレースを急ぎで評価してて、 「μ-op に分解されてない x86-64 トレースくっそ遅いんですけど」 「なんで arm 64 は2箇所同時にストアすんだよ…」 「sparc は遅延スロットのせいで分岐予測器の学習がうまく動かないよう」 とかそれぞれ地獄だった
1
25
84
@r_shioya
R. Shioya
8 months
Intel や IBM あたりの人が書いてる論文で,普通に考えると N 個回路がいるのに1個としてさらっと書かれてるみたいな不思議なのがたまにあって,特許とか見て凄い考えるとそれが超絶技巧だとわかったりするんだけど,こんな事さらっと1文で書かんといてくれと思いつつ わかるとちょっと感動する
1
9
85
@r_shioya
R. Shioya
7 months
今の x86 は Intel も AMD も 5GHz とか 6GHz とかの恐ろしい速度で動くけど,あんなの脳を焼き切って反転術式で治すばりの無茶しなきゃ無理で,そりゃ電力効率は酷いことになるだろうなと
1
28
84
@r_shioya
R. Shioya
1 year
MICRO に通った論文,ベストペーパーにノミネートされてた!とてもうれしい
Tweet media one
2
23
84
@r_shioya
R. Shioya
2 years
ティアフォーさんで作ってる SIMT プロセッサ(GPU ぽいやつ)のアーキの発表をしにいったら結構深いところで突っ込んできてくれた方がいて、終わった後に色々お話ししたらゲーム機の 3DS の GPU を設計した方だったようで、色々アーキテクチャ面の話ができてとても楽しかった
2
12
83
@r_shioya
R. Shioya
5 months
リンク先のこの説明は誤解があって,デコーダは1つで良いしスケジューラや演算器も無変更でいける. 太るのは主にリネームのマップテーブルとか. > HTT用に2つのデコーダをそれぞれ用意したり、特別なスケジューラを用意したりと、それが演算器の肥大を招き、電力効率の悪化を招く結果になっている。
1
20
80
@r_shioya
R. Shioya
3 months
分岐予測器のところをよく見ると 2-taken/2-ahead とあって,これは2個先の分岐まで一気に予測するの意味だと思うのだけど,なのでこれは両パスではなく単一パス上の2つの連続した(非連続も許すかも)ベーシックブロックを同時にデコードできるようにしたと言うことなんじゃないかという気がする
@kazuho
Kazuho Oku
3 months
Zen 5の命令 dual decode、分岐予測性能を上げる文脈で出てくるってことは、分岐の taken と not-taken の両方をデコードするってこと? Zen 4では分岐予測がuop cache持ってたのをやめたのかしら cf.
Tweet media one
Tweet media two
2
12
39
1
26
79
@r_shioya
R. Shioya
5 years
ヘネパタ薄くなった? 薄い本になっちゃったの? というご意見が寄せられているので、比較してみた。 左から今回の、原著第五版、日本語第四版、原著第四版、日本語初版。
Tweet media one
2
41
78
@r_shioya
R. Shioya
10 days
とりあえず Genus, DC, Vivado の階層エリアレポートを読めるのができた Vivado での RSD プロセッサ合成結果の可視化デモはこちら
@r_shioya
R. Shioya
14 days
ひっそり作って自分で使ってたファイルサイズの可視化ツール,これがそのまま回路サイズの可視化に使える事を後輩が発明してめっちゃ役に立つので回路用の HTML 版を作っていたのだけど,大体動くようになってきた
18
396
2K
0
16
77
@r_shioya
R. Shioya
2 years
ベクトル拡張のなにがダメだと思うのか,と言うと, ・とにかく仕様が複雑で巨大.命令セットシミュレータとか単に動くだけのものを作るのもしんどい ・スーパスカラに組み込んだ時にハードがどうなるかを多分考えてない(ヒドい事になるので,「どう実装するか」が研究としてなり立ってしまうレベル)
1
27
73
@r_shioya
R. Shioya
10 days
可視化デモを見た人からなんで 32bit レジスタより1bitの ready 表の方がでかいんだツッコミが入り,調べたらコスト関数が間違っててめっさ効率の悪い方法で表が組まれて膨らんでるのがわかった・・・ あと ready が rady になってたり vivado は vivdao になっててもうだめだ
Tweet media one
3
10
74
@r_shioya
R. Shioya
1 year
if 文なしで書けるので速いと言う話を何件かみたけど,分岐予測が当たってる分には大概 if のままのが速いのと,最近の一部の CPU は分岐予測が外れる小さい if 文を動的に分岐じゃないコードに書き換えて実行したりもするので,素直に if で書くのが最適ということもありそう
1
21
70
@r_shioya
R. Shioya
3 years
これが MIPS の ABI だとアセンブラが疑似命令の展開に使えるようレジスタが1個予約されてたんだけど,RISC-V の標準 ABI ではそれがないのがつらみの元だった.
1
19
68
@r_shioya
R. Shioya
2 years
@norix_v 確かに安全面で光のが良さげですけど、コストが高かったりするんですかね
1
12
68
@r_shioya
R. Shioya
10 months
この前 MICRO で発表した論文,Hacker News に誰かが投稿したおかげで ACM から 10000 件以上ダウンロードされてた(普通は行ってもせいぜい数百件) 自分のサイトなら論文公開できるんだから,お金つんでわざわざオープンアクセスにする意味とかあるんかなと思ってたけど,こう言う事もあるんだなぁと
Tweet media one
1
19
68
@r_shioya
R. Shioya
2 years
RISC-V の基本部分は過去の大量の屍をみた反省が割と生かされていると思うのだけど,一方で可変長ベクトル命令については特に現代の CPU に組み込まれる形で使われる場合にどう作れば良いのかは,まだあんまりわかってないのかなもなぁという気もする
3
24
66
@r_shioya
R. Shioya
5 years
この論文だと、メモリを引っこ抜いて液体窒素に漬け込んで一時間後に戻したらデータが化けてたのは0.17%だったとかで、思ってた以上に冷やすとデータのこるんだなと言う話も
1
64
62
@r_shioya
R. Shioya
2 years
@wataken44 @norix_v なんか各座席の装置も搭載数が多いのもあってぶっ壊れまくるそうで、そのメーカーさんは世界中の空港にサポートセンターあって即座に修理できるようにしてるそうなんだけど(確かに国際線でなんも映らん席は辛い)、配線まで壊れやすいと洒落にならんね
3
16
67
@r_shioya
R. Shioya
3 years
原理的には範囲を超えて遠くに飛ぶ場合はレジスタ間接分岐にすれば良いんだけど,そんな単純にはいかなかった. まず,これをアセンブラのレベルでの疑似命令からの置換みたいな方法でやろうと思うと,その場で使えるレジスタがないし,スタックへの退避復帰を使おうとすると置換の域を超えてしまう.
1
22
65
@r_shioya
R. Shioya
5 months
自分でもやってみたけど,これ元がごく単純なプログラムだとはいえ x86 の命令列としてみるときちんと正解してて,なかなかすごいな
1
9
64
@r_shioya
R. Shioya
3 years
学生さんが「理屈はわからないけど脳内ニューラルネットが異常を検知した」みたいなこと言ってて,ニューラルネットはもともと脳内やんけと思いつつも,言いたいことはわかる
1
14
62