転移学習 | Tags | Autognosis

AI・機械学習

2026年7月12日 21:06

Conceptual visualization of knowledge distillation showing a large opaque black geometric structure transferring knowledge through flowing data streams to a smaller transparent crystalline structure, representing black-box AI model distillation

ブラックボックス・パラドックス：モデル性能が理解を超える場合

ブラックボックス・パラドックス：モデル性能が理解を超える場合主張：ブラックボックス大規模言語モデルの知識蒸留は、プロプライエタリなシステムを大規模に展開する組織にとって運用上の必要性となっています。しかし内部モデルへのアクセス欠如—重み、活性化、中間表現—は知識転移メカニズムを根本的に制約します。従来の蒸留では重み空間の類似性を最適化していましたが、ブラックボックスシナリオでは入出力ペアのみから行動推論を行う必要があり、異なる技術的および認識論的課題...

#知識蒸留 #大規模言語モデル #機械学習

--

Share

AI・機械学習

2026年3月31日 14:50

Split illustration contrasting idealized AI research metrics on the left with complex real-world clinical deployment challenges on the right, separated by a translucent barrier, representing the gap between laboratory performance and operational healthcare systems

前置き

前置き事前学習の成果と運用現場のギャップトランスフォーマーベースのモデルは、大規模な自己教師あり事前学習を通じて、縦断的な電子健康記録（EHR）の予測精度において改善を示しています。GT-BEHRTおよび関連アーキテクチャは、患者軌跡から大規模に分散表現を学習することで、再入院、死亡率、有害事象を含む臨床転帰の予測において測定可能な成果を達成しています。しかし、この実験室環境での性能は、根本的なメカニズムを隠蔽しています。すなわち、研究環境での性能と運用...

#深層学習 #グラフニューラルネットワーク #自然言語処理

--

Share

AI・機械学習

2026年3月31日 09:49

Split illustration comparing biological learning and AI processing: a human brain with dynamic, glowing neural connections on the left contrasts with a rigid, geometric AI network structure on the right, highlighting the fundamental difference between adaptive learning and fixed pattern matching

前置き

前置き AI システムにおける「学習」とは、実際のところ何を意味するのか「学習」という用語は、認知科学と機械学習エンジニアリングの間で異なる意味を持っており、この区別は運用段階の AI デプロイメントにおいてしばしば曖昧にされています。認知科学における学習とは、生物が内部的な心的モデルを更新し、新しい情報を既存の知識構造に統合し、獲得したパターンを新しい文脈へと一般化するプロセスを指します（Schacter et al., 2007）。このプロセスには神...

#機械学習 #大規模言語モデル #ニューラルネットワーク

--

Share

AI・機械学習

2026年3月18日 18:52

Hierarchical visualization of chemical molecular structures arranged in ascending complexity with neural network connections, representing AI-driven curriculum learning for chemical reaction prediction

RxnNano: 階層的カリキュラム学習を用いたコンパクト言語モデルの化学反応・逆合成予測への応用

RxnNano: 階層的カリキュラム学習を用いたコンパクト言語モデルの化学反応・逆合成予測への応用化学反応予測: スケーリングの先へ化学反応予測は、医薬品開発パイプラインと合成計画ワークフローの加速化を支える基盤的な能力です。現在の最先端アプローチは、パラメータスケーリングとデータセット拡張に大きく依存しており、この前提は検証に値します。実証的証拠が示すのは、これらの戦略は新規反応タイプや訓練データが疎な化学領域に直面すると、脆弱なモデルを生み出すとい...

#大規模言語モデル #機械学習 #モデル効率化

--

Share

AI・機械学習

2026年2月28日 09:49

Visualization of time series decomposition showing a single waveform separating into three distinct components: a smooth trend line, a regular seasonal pattern, and irregular residual noise, rendered in blue and teal gradients against a light analytical background

季節トレンド分解の再検討：時系列予測の強化に向けて

季節トレンド分解の再検討：時系列予測の強化に向けて現代的予測における分解の必然性従来の時系列予測では、ニューラルネットワークが生の系列からトレンド、季節性、周期的パターン、ノイズを同時に学習する必要があります。この同時最適化は二つの明確な課題をもたらします。第一に最適化の困難性です。モデルは異なる時間特性を持つ複数の成分にわたって競合する目的関数のバランスを取らなければなりません。第二に解釈可能性の低下です。学習された表現が複数の信号源を混在させるため、...

#時系列予測 #深層学習 #ニューラルネットワーク

--

Share

AI・機械学習

2026年1月23日 16:02

A split-screen digital illustration showing call center audio waves and conversation data on the left being transformed through a central processing pipeline into structured neural network patterns on the right, representing the conversion of call recordings into AI training data

コールセンターQ&Aデータセットを通じたドメイン特化型LLMの適応

コールセンターQ&Aデータセットを通じたドメイン特化型LLMの適応 LLMのファインチューニングには高品質な指示データが必要主張: 大規模言語モデルは、汎用的な事前学習済み重みのみに依存するのではなく、運用コンテキストに基づいた質問-回答ペアという形式の高品質な指示フォーマットデータセットでファインチューニングすることで、ドメイン特化型の能力を獲得する。理論的基盤: 事前学習済みLLMは広範な言語パターンをエンコードしているが、制約さ...

#大規模言語モデル #ファインチューニング #自然言語処理

--

Share

AI・機械学習

2026年1月23日 04:02

Abstract visualization of transfer learning showing a neural network with glowing blue nodes transferring knowledge through flowing data streams to multiple smaller networks against a dark gradient background

マルチソース転移学習におけるソース重みと転移量の統合最適化:漸近的フレームワーク

マルチソース転移学習におけるソース重みと転移量の統合最適化:漸近的フレームワークデータ不足環境における転移学習転移学習は機械学習における根本的な課題に対処する:ターゲットタスクのラベル付きデータが限られている場合に、許容可能なモデル性能を達成することである。実務者は、希少なターゲットデータでモデルをゼロから訓練するのではなく、関連するソースタスクから学習した表現とパラメータを活用して、サンプル複雑度を削減し、汎化性能を向上させる(Yosinski et ...

#転移学習 #機械学習 #最適化アルゴリズム

--

Share

AI・機械学習

2026年1月17日 18:37

Split illustration showing medical diagnostic codes and digital data on one side connecting to social determinant icons including housing, food, and community on the other side, representing the intersection of healthcare systems and social factors

臨床データにおける隠れたギャップ

臨床データにおける隠れたギャップ健康の社会的決定要因(SDoH)は、住居の安定性、食料の安全保障、雇用状況、交通手段へのアクセス、社会的孤立として運用され、患者の罹患率および死亡率の確立された相関要因である(Healthy People 2030フレームワーク;米国保健福祉省)。その文書化された臨床的重要性にもかかわらず、SDoH変数は構造化された電子健康記録(EHR)システムにおいて体系的に過小評価されたままである。ICD-9分類を含む現在の診断コーディング基...

#自然言語処理 #名前付きエンティティ認識 #機械学習

--

Share