4th month @Stanford

TL;DR

Research: 外観検査への生成 AI 適用として、マルチモーダル LLM の検討と、システムへの実装を進めている。
Life: クリスマスシーズンを満喫。出会いと交流を楽しんでいる。冬も暖かい。

0. San Fransisco

坂の上から一望できる美しい街並みと最高の気候で世界中から人々がここに住みついてきたのも納得。しかし治安は悪化の一途を辿っており、至る所にホームレスがいて、車上荒らしも多発している。リモートワークによる昼間人口の減少や、$950 未満の万引きの軽犯罪化による集団強盗の多発で、多くの小売が撤退し、テナントは空きだらけ。 IT とリベラルと多様性の街が、今後どうなっていくのか興味深い。

1. Research

(12/10-16 NeurIPS)
12/11 MeetMakers @D.School,Stanford
12/13 re:InventRecap @AWS,SF

ラボは NeurIPSで大忙し。その終了と同時に冬休み突入。

Progress

PoC: 外観検査サービスの GPT4V ベースの基本アプリを構築。Prompting 等の検討を進めている。
- 検討途中だが、現状の LLM の Zero-shot で教師あり学習の匹敵する精度を出すのは難しそう。
- ある程度の性能は出るので、中間段階の AI として、検査仕様の見直しや、システムの "Early Deploy Strategy" に寄与できると期待。
論文調査等
- AGI
  - Thinking System: 推論時間を精度に変える"think"するユニットの実現。(ref. Tree of Thought)
  - Self-Improving AI: ~= LLM Alpha Go
  - Superalignment: 教師(人間)より性能の遥かに高い生徒(AI)をどう監視していくか
- LLM Architecture
  - Mamba: Attention 代替
  - Hyena: Attention 代替
  - Monarch Mixer: Attention 代替
- Material Science
  - GNoME: GNN と DFT で新物質候補を探索 (Deepmind)
  - MatterGen: StableDiffusion で物質候補を生成 (Microsoft)

Future Plan

マルチモーダルな Prompting の試行錯誤 (Few-shot Example, Visual Reference Prompting, etc.)
GPT4V 以外のマルチモーダル LLM エンジンの実装と、性能比較 (LLaVA, Gemini)
edge 推論の実現と、そもそもの要否の検討 (Gemini nano, Ollama)
欠陥画像生成等にも触手を伸ばしたい

MeetMakers

D.School で Design Thinking の講義の成果報告会に参加。

re:InventRecap

自宅から 1 時間。AWS San Fransisco で最新リリースをキャッチアップ。

Bedrock: 生成 AI 系の LLMOps サービス。FM モデル利用、ファインチューニング、RAG、Agents 等。
Q: AWS ドメインに特化した Chatbot。Google の DuetAI のような感じ。
Sagemaker Hyperpod: CustomFM の学習環境。
One: Palm 認証が面白い(手相で Identity 認証)。
Monitron: 産業用異常検知サービス。

2. Life

12/04 🎄Celebration @Downtown,MV
12/05 ESL: 🇺🇸Mary(Are friendship forever?)
12/08 🍽️StanfordCS
12/09 🎄Concert @MemorialChurch
12/10 🍵🇺🇸Liz
12/14 🎄Party @🇺🇸Tom&Steffi🏠
12/16 🎄Party @My🏠
12/17 🍽️🇺🇸Liz
12/25 🎄Party @🇺🇸Liz🏠
12/27 🍵🇺🇸Arden
12/31 ✈️ -> 🇲🇽MexicoCity

12/01,08,15 GlobalChef 🍽️

Christmas Events

🎄 シーズン。沢山のイベントに参加。

4th month @StanfordMasahiro RikisoDecember 30, 2023