変化の速い AI を研究対象として扱うための観察軸に関する関連研究メモ

作成日: 2026-05-11

位置づけ: 「変化の速い AI を研究として扱うための観察軸を探る研究」に近い先行研究・参考研究を調査し、研究の位置づけを整理するためのメモ。詳細な文献情報は research/references.md に追記済み。


1. まず結論

現時点で見る限り、「変化の速い AI を研究対象として扱うための観察軸を、AI 介在型の制作・開発・研究・設計実践のクリティカル・インシデントから探索する」という形で、そのまま一致する研究は見つかっていない。

ただし、かなり近い研究群は複数ある。特に近いのは、次の4系統である。

  1. 生成 AI の非決定性・急速な変化により、HCI の評価方法や研究方法を更新する必要があると論じる研究
  2. Human-GenAI Interaction を、利用目的、制御、フィードバック、関与レベル、タスク、ユーザー行為などの軸で分類する研究
  3. 生成 AI が仕事・デザイン・組織実践に入り込むことで、ワークフロー、知識、評価、フィードバックループが再構成されることを扱う研究
  4. AI との協働を、人間同士の協働、文脈、翻訳、信頼、修復といった社会的相互作用の概念から捉え直す研究

したがって、この研究は完全な未踏領域ではない。むしろ、HCI / HAI / GenAI evaluation / sociotechnical AI / design practice の複数領域にまたがる既存研究の交差点にある。

一方で、既存研究の多くは、設計原則、評価方法、タクソノミー、研究アジェンダを提示するものが中心である。AI 利用中に判断・違和感・修復・媒介物更新が露出する具体的な出来事を、クリティカル・インシデントとして記録し、そこから観察軸を探索するという立て方は、差分として十分に残りうる。


2. かなり近い研究群

2.1 変化する AI をどう評価・研究するか

Evaluating Generative AI in the Lab は、生成 AI が同じ入力でも異なる出力を返す非決定的なシステムであるため、従来の HCI ラボ評価が前提としてきた制御、一貫性、比較可能性が揺らぐと論じている。これは、本研究の「AI を固定的な対象として扱いにくい」という問題意識にかなり近い。

Dimensions of Generative AI Evaluation Design は、生成 AI の評価を、評価環境、タスクタイプ、入力源、相互作用スタイル、期間、指標タイプ、採点方法などの次元で整理している。これは「観察軸」そのものではないが、生成 AI を研究・評価する際に、どの設計上の選択肢を明示すべきかを示す枠組みとして参考になる。

HCI for AGI は、より大きな研究アジェンダとして、AI が高度化する時代に HCI の相互作用技法、評価方法、ベンチマーク、データ収集方法を更新する必要があると論じる。自分の研究は、この大きな議論の中で、具体的に「AI が入り込んだ実践のどの出来事を観察すればよいか」を探る研究として位置づけられる。

Facilitating Longitudinal Interaction Studies of AI Systems は、AI ツールの利用が、ユーザーの学習、適応、再利用、ワークフロー統合を通じて時間的に変化するため、単発評価だけでは不十分だとする。自分の研究では大規模な縦断研究をすぐ行うわけではないが、インシデントを時間的に記録する必要性の根拠になる。

Capturing a moving target は、AI を moving target として研究すること自体を論じる文献であり、上位問題に直接近い。ただし、HCI や制作・開発実践の観察軸を具体的に提示するものではない。

2.2 Human-GenAI Interaction の分類研究

An HCI-Centric Survey and Taxonomy of Human-Generative-AI Interactions は、Human-GenAI Interaction を包括的に分類するサーベイである。利用目的、フィードバック、人間からモデルへのコントロール、関与レベル、応用領域、評価戦略などを整理しており、観察軸探索という点では最も近い文献の一つである。

ただし、この研究は文献サーベイから既存の Human-GenAI Interaction のデザイン空間を整理している。一方、自分の研究は、実際の AI 利用中に起きる判断・違和感・修復の出来事から、観察軸を下から立ち上げようとしている。この違いは重要である。

Taxonomy of User Needs and Actions は、1193件の人間-AI会話ログを分析し、ユーザーが AI に何を求め、どのような行為をしているのかを分類している。これは、AI 利用を「何をしているのか」という語彙で記述する研究としてかなり参考になる。

ただし、この研究は主に会話ログに現れるユーザー行為の分類である。自分の研究は、会話内容だけでなく、スライド、UI、コード、README、skill、デザインシステム、レビューコメントなどの媒介物や、ワークフロー上の位置も含めて見る点で差分を出せる。

Human-AI Task Tensor は、タスク定義、AI 統合、相互作用モダリティ、監査要求、出力定義、意思決定権限、AI 構造、人間のペルソナという8次元で、生成 AI 時代の仕事を整理する。委譲範囲、人間の介入点、監査、出力評価を考えるうえで有用である。

Interactive AI Alignment は、AI との相互作用を、Specification Alignment、Process Alignment、Evaluation Alignment に分ける。これは、自分の研究でいう目的・制約の外部化、AI の実行過程、人間による評価・検証とかなり対応する。


3. 実践研究として近いもの

Lessons for GenAI Literacy from a Field Study of Human-GenAI Augmentation in the Workplace は、プロダクト開発、ソフトウェアエンジニアリング、デジタルコンテンツ作成という複数の仕事領域で、生成 AI がどう使われているかをフィールドスタディで調べている。本研究の候補領域と近く、対象者の専門性や実践文脈を記録する必要性を補強できる。

Towards a Working Definition of Designing Generative User Interfaces は、生成 UI の概念を、文献レビュー、専門家インタビュー、ケース分析から定義しようとしている。これは、変化中の実践に対して新しい語彙や定義をつくる研究として参考になる。特に、研究が「AI が実行を代替する」ことではなく、「新しい実践を記述可能にする」ことに向かう点が近い。

Generative AI Capability as a Socio-Technical Configuration in Organizations は、生成 AI を単なる技術ではなく、知識、ワークフロー、フィードバック、組織能力と結びついた社会技術的構成として捉える。自分の研究で「媒介物」や「組織的知識」を扱う際、社会技術的な背景づけに使える。

What’s so Human about Human-AI Collaboration, Anyway? は、人間同士の協働に関する社会科学的概念を、生成 AI との協働に持ち込む研究である。Indeterminacy、Contextual Integrity、Contextual Controls、Trust/Mistrust/Vulnerability、Translation という5要素は、自分の研究でいう文脈、修復、翻訳、媒介に近い。


4. 自分の研究との差分

既存研究から見ると、自分の研究が成立しうる差分は次のあたりにある。

第一に、既存研究は「生成 AI の評価方法」「Human-GenAI Interaction の分類」「生成 AI アプリケーションの設計原則」「組織導入」のように、それぞれの領域で枠組みを提示している。一方、自分の研究は、変化の速い AI を研究対象として扱うために、AI 介在型実践の中でどの出来事を観察すればよいかを探る点に特徴がある。

第二に、既存のタクソノミー研究は、文献や会話ログをもとに「人間-AI相互作用の種類」を整理するものが多い。一方、自分の研究は、実践中に判断・評価・違和感・修復が表に出た具体的な出来事を、クリティカル・インシデントとして集める予定である。ここでは、ユーザーが何を言ったかだけでなく、何を渡したか、何を見て違和感を持ったか、何を修正したか、どの媒介物を更新したかを見る。

第三に、既存研究には「AI 評価方法を更新する必要がある」という議論はあるが、「制作・開発・研究・設計の AI 利用実践を観察窓として、変化の速い AI を研究可能にする観察軸を探索する」という研究目的は、まだ明確には見つかっていない。

第四に、CIT との組み合わせは差分になりやすい。CIT 自体の先行研究はあるが、それを AI 介在型実践における暗黙知・評価基準・媒介物・修復の露出を拾う方法として使う立て方は、少なくとも今回の検索では直接一致するものは見つかっていない。


5. この研究の位置づけ案

現時点では、この研究は次のように位置づけられる。

生成 AI や AI エージェントの急速な発展により、HCI や HAI では、生成 AI の非決定性、相互作用の曖昧さ、評価方法の再設計、実践への組み込みが重要な研究課題として浮上している。既存研究は、Human-GenAI Interaction の分類、生成 AI 評価の次元、AI とのインタラクティブなアラインメント、組織・実践への導入などについて有用な枠組みを提示している。

しかし、変化の速い AI を研究対象として扱う際に、AI が入り込んだ制作・開発・研究・設計実践の中で、どのような出来事を記録すれば、目的、制約、評価基準、暗黙知、人間の介入点、媒介物、修復の手がかりを捉えられるのかは、まだ十分に整理されていない。

そこで本研究は、AI 介在型実践の全体を均等に観察するのではなく、判断・違和感・評価・修復が露出する出来事をクリティカル・インシデントとして記録し、それらをワークフロー上の位置、媒介物、外部化された基準、人間の介入点、文脈条件から分析することで、変化の速い AI 実践を研究可能にする観察軸を探索する研究として位置づけられる。


6. 今後追加で見るとよさそうな周辺領域

今回の検索では、HCI / HAI / GenAI evaluation / sociotechnical AI を中心に見た。次に深掘りするなら、以下が候補になる。

  • STS の「infrastructure」「articulation work」「sociotechnical imaginaries」
  • CSCW の「coordination work」「repair」「breakdown」「work practice」
  • デザイン研究の「reflection-in-action」「design rationale」「design judgment」
  • AI 導入研究の「appropriation」「domestication」「organizational routines」
  • 質的研究方法論の「incident-based study」「diary study」「experience sampling」「grounded theory」と CIT の違い

特に articulation workrepair は、自分の研究の「暗黙知の外部化」「修復」「媒介物更新」と相性がよい可能性がある。