- Park, H., Huynh, K., Eiband, M., Dillmann, J., Mayer, S., & Sedlmair, M. (2026). Evaluating Generative AI in the Lab: Methodological Challenges and Guidelines. arXiv. https://arxiv.org/html/2601.16740v2
- 概要:生成 AI の非決定性が、従来の HCI ラボ評価の前提(制御可能性、一貫性、比較可能性)を揺るがすことを、4つの GenAI ユーザースタディの反省的マルチケース分析から整理。信頼・意図整合・イベントログなどを含む18の実践的推奨を提示している。
- 関連性:本研究の「変化・非決定性のある AI を、従来の固定的な評価対象として扱いにくい」という問題意識に非常に近い。特に、研究方法上の困難そのものを分析対象にしている点が参考になる。
AI Research Lab
参考文献
参考文献
51件 — ../research/references.md
研究方法論・評価設計・「変化するAI」を扱う枠組み
- Dow, P. A., Vaughan, J. W., Barocas, S., Atalla, C., Chouldechova, A., & Wallach, H. (2024). Dimensions of Generative AI Evaluation Design. arXiv. https://arxiv.org/html/2411.12709v1
- 概要:生成 AI 評価を設計する際の重要な選択肢として、評価環境、タスクタイプ、入力源、相互作用スタイル、期間、指標タイプ、採点方法などの次元を提案。生成 AI 評価の混乱を、評価デザインの次元として整理しようとする論考。
- 関連性:「何を観察・評価の単位にすればよいか」を整理する研究として近い。自分の研究でいう観察軸を考える際に、評価設計側の先行枠組みとして参照できる。
- Morris, M. R. (2025). HCI for AGI. ACM Interactions. https://interactions.acm.org/archive/view/march-april-2025/hci-for-agi
- 概要:AGI に向かう時代に HCI が担うべき研究課題を、相互作用技法、インターフェースデザイン、デザイン方法、評価方法、ベンチマーク、データ収集技法などに分けて論じる。従来の実行・評価のガルフに加え、AI のプロセスを理解・制御する難しさも扱う。
- 関連性:「高度化する AI を研究・設計するために HCI 側の方法や評価を更新する必要がある」という大きな研究アジェンダとして参考になる。本研究はこの大きな議論の中で、制作・開発・研究・設計実践における観察軸探索に絞る位置づけにできる。
- Long, T., Wang, S., Fabre, É., Wang, T., Sathya, A., Wu, J., et al. (2025). Facilitating Longitudinal Interaction Studies of AI Systems. UIST Adjunct. https://arxiv.org/html/2508.10252v1
- 概要:AI システムとの相互作用は、ユーザーの学習、適応、再利用、ワークフロー統合を通じて時間的に変化するため、単発の評価では不十分だと論じるワークショップ論文。長期的な HCI/UIST 研究を促進するための課題とプロトコル設計を扱う。
- 関連性:本研究が扱う「変化する AI 実践」は、モデル側だけでなくユーザー側の使い方・認識も変化する。CIT を用いた少数インシデント記録に加え、将来的に縦断的・継続的な実践記録を考える際の重要な参照点になる。
- Stollberger, J., Anand, S., & Dick, P. (2025). Capturing a moving target: Developing research on and with AI for Human Relations. Human Relations. https://durham-repository.worktribe.com/output/3790245/capturing-a-moving-target-developing-research-on-and-with-ai-for-human-relations
- 概要:AI を「moving target」として捉え、急速に進化する AI を対象に研究すること、また AI を使って研究することの両面について論じるエディトリアル。定義や概念が技術進化に影響され続けるため、研究者は AI を固定的対象として扱う難しさを意識する必要があるとする。
- 関連性:「変化の速い AI を研究として扱うには」という本研究の上位問題に最も直接的に接続する文献候補。ただし内容は組織・人事系ジャーナルのエディトリアルであり、HCI 実践の観察軸そのものを提示するものではない。
Human-GenAI Interaction の分類・観察軸
- Shi, J., Jain, R., Doh, H., Suzuki, R., & Ramani, K. (2024). An HCI-Centric Survey and Taxonomy of Human-Generative-AI Interactions. arXiv. https://arxiv.org/html/2310.07127v2
- 概要:291本の論文をもとに、人間と生成 AI の相互作用を HCI 観点から分類したサーベイ。利用目的、モデルから人間へのフィードバック、人間からモデルへのコントロール、関与レベル、応用領域、評価戦略などの次元を整理している。
- 関連性:本研究の「観察軸を探る」という目的に最も近い既存分類の一つ。ただし文献サーベイによる相互作用デザイン空間の整理であり、実践中の判断・評価・暗黙知が露出するインシデントを集める研究とは差分を出せる。
- Shelby, R., Diaz, F., & Prabhakaran, V. (2025). Taxonomy of User Needs and Actions. arXiv. https://arxiv.org/html/2510.06124v2
- 概要:1193件の人間-AI会話ログを質的に分析し、ユーザーが AI に何を求め、どのような行為をしているのかを三層のタクソノミーとして整理。情報探索、合成、手続き的ガイダンス、コンテンツ作成、社会的相互作用、メタ会話などを含む。
- 関連性:「AI 利用の中で実際にユーザーが何をしているのか」を観察語彙として整備する研究。自分の研究では会話ログだけでなく、制作・開発実践のワークフローや媒介物更新まで含める点が差分になりうる。
- Doshi, A. R., & Moore, A. P. (2025). Toward a Human–AI Task Tensor: A Taxonomy for Organizing Work in the Age of Generative AI. Forthcoming in Handbook of AI and Strategy. https://arxiv.org/pdf/2503.15490
- 概要:生成 AI 時代のタスクを整理するために、タスク定義、AI 統合、相互作用モダリティ、監査要求、出力定義、意思決定権限、AI 構造、人間のペルソナという8次元の「Human-AI Task Tensor」を提案。
- 関連性:AI 介在型実践を、タスク・権限・監査・出力定義などの次元で整理する枠組み。本研究の観察軸候補のうち、委譲範囲、人間の介入点、評価・監査の位置づけを考える際に特に参考になる。
- Terry, M., Kulkarni, C., Wattenberg, M., Dixon, L., & Morris, M. R. (2024). Interactive AI Alignment: Specification, Process, and Evaluation Alignment. arXiv. https://arxiv.org/abs/2311.00710
- 概要:自然言語で望む成果を指定し、AI が実行過程を担う相互作用を、Specification Alignment(何をするか)、Process Alignment(どう行うか)、Evaluation Alignment(出力をどう検証するか)の3つに整理。ノーマンの実行・評価のガルフを AI 文脈に再解釈する。
- 関連性:目的・過程・評価という軸で AI 介在型実践を捉えるための強い理論的参照点。本研究の「目的・制約・評価基準・修復」を分析する枠組みと直接接続できる。
AI が入り込んだ実践・組織・デザインプロセスの研究
- Johri, A., Schleiss, J., & Ranade, N. (2025). Lessons for GenAI Literacy from a Field Study of Human-GenAI Augmentation in the Workplace. arXiv. https://www.arxiv.org/pdf/2502.00567
- 概要:プロダクト開発、ソフトウェアエンジニアリング、デジタルコンテンツ作成の3領域における生成 AI 利用を比較するフィールドスタディ。職務や専門知識に応じて、GenAI の使われ方や必要な知識が大きく異なることを示している。
- 関連性:本研究が候補にしている制作・開発・研究・設計の実践タイプに近い。AI 利用経験や専門性を「比較軸」ではなく「文脈条件」として記録する必要性を補強できる。
- Lee, K. (2025). Towards a Working Definition of Designing Generative User Interfaces. DIS Companion. https://arxiv.org/html/2505.15049v1
- 概要:文献レビュー、専門家インタビュー、ケース分析を通じて、Generative UI とその設計実践の作業定義を提案。計算的共創、デザイン空間探索、表現の流動性、文脈適応、選択から統合への移行などを構成要素として整理している。
- 関連性:UI・デザイン生成の領域で、「新しい概念を定義するために、文献・実践者・ケースを組み合わせる」研究として方法上も近い。研究を「AI実行代替」ではなく「新しい実践を記述する語彙づくり」として置く際の参考になる。
- Takala, E. (2026). Generative AI Capability as a Socio-Technical Configuration in Organizations. Master’s thesis, Aalto University. https://aaltodoc.aalto.fi/server/api/core/bitstreams/709a7dc8-1908-4f14-9479-255c645c3acb/content
- 概要:生成 AI 能力を、単なる技術導入ではなく組織内の社会技術的構成として捉える修士論文。10件の半構造化インタビューをもとに、生成 AI の価値創出には知識、ワークフロー統合、反復的フィードバック、組織能力の再構成が必要だと論じる。
- 関連性:本研究で扱う「媒介物」「組織的知識」「ワークフロー統合」「フィードバックループ」を、組織レベルの社会技術的視点から補強できる。修士論文としての構成や方法設計の参考にもなる。
- Watkins, E. A., Moss, E., Raffa, G., & Nachman, L. (2025). What’s so Human about Human-AI Collaboration, Anyway? Generative AI and Human-Computer Interaction. arXiv. https://arxiv.org/html/2503.05926v1
- 概要:人間同士の協働に関する社会科学の知見を、生成 AI との協働設計へ接続する論考。Indeterminacy、Contextual Integrity、Contextual Controls、Trust/Mistrust/Vulnerability、Translation の5要素を提示し、製造現場の AI アシスタント開発事例から説明している。
- 関連性:本研究の「目的・文脈・修復・媒介・翻訳」を考える上で非常に近い。特に、AI との協働では人間側の文脈理解や翻訳作業が不可欠になるという点が、CIT で拾うべき出来事の理論的支えになる。
追加検索:AI が入り込んだUX・創造的実践
- Takaffoli, M., Li, S., & Mäkelä, V. (2024). Generative AI in User Experience Design and Research: How Do UX Practitioners, Teams, and Companies Use GenAI in Industry? DIS 2024. https://doi.org/10.1145/3643834.3660720
- 概要:複数企業・複数国の UX practitioner 24名にインタビューし、UX デザイン・リサーチ実践における GenAI 利用を調査。会社レベルの方針不足、チーム単位の実践不足、個人による文章系タスク中心の利用、出力評価やプロンプト生成の訓練ニーズを明らかにしている。
- 関連性:本研究の候補領域である UI・デザイン生成、UX 実践にかなり近い。AI 利用を個人のプロンプト技法ではなく、チーム実践・会社方針・出力評価の問題として扱う必要性を示している。
- Li, J., Cao, H., Lin, L., Hou, Y., Zhu, R., & El Ali, A. (2024). User Experience Design Professionals’ Perceptions of Generative Artificial Intelligence. CHI 2024. https://doi.org/10.1145/3613904.3642114
- 概要:20名の UX デザイナーへのインタビューから、経験豊富なデザイナーは GenAI を支援的な道具として捉えつつ、人間側の originality, creativity, empathy, enjoyment, agency を重視していることを示す。一方で、若手デザイナーにはスキル低下や職の置換、創造性の疲弊への懸念がある。
- 関連性:AI による生成が進んでも、人間側の評価・判断・agency が残るという議論の補強になる。ただし、この研究は認識・期待のインタビューが中心であり、本研究が扱いたい具体的なインシデントや媒介物更新とは分析単位が異なる。
- Clarke, M. F., & Joffe, M. (2025). Beyond Replacement or Augmentation: How Creative Workers Reconfigure Division of Labor with Generative AI. arXiv. https://arxiv.org/pdf/2505.18938
- 概要:17名の創造的労働者へのインタビューから、生成 AI を単なる置換・拡張ではなく、実践者が AI との分業を状況的に再構成するものとして分析。prompting を situated, reflexive delegation と捉え、AI の役割境界を継続的に修復し、ステークホルダーに対して出力を説明可能・信頼可能にする作業を示している。
- 関連性:本研究の「委譲」「修復」「評価」「責任」「媒介物」の議論にかなり近い。特に、AI との分業が固定的ではなく、実践中に構成・修復されるという視点は CIT で拾うべき出来事を考える際に有用。
公開テンプレート調査(URL追記)
- デジタル庁 (2026). policy-dashboard-assets. GitHub. https://github.com/digital-go-jp/policy-dashboard-assets
- 概要:Power BI向けのデザインテンプレート(
.pbit)、テーマ(.json)、行政区域ポリゴンデータを公開している公式リポジトリ。powerbi-theme-pbitにはSolidGray/Blue/LightBlue/Green/Cyan/Red/Orangeの7色テンプレート、powerbi-theme-jsonに対応テーマJSON、data/mapに都道府県・市区町村GeoJSONが含まれる。 - 関連性:現在手元にある
デザインテンプレート_SolidGray_1_0_0.pbitの出典と配布元を特定できる。利用規約上、加工して利用する場合は原則出典記載不要、無加工公開時は出典記載が必要という実務ルールも明記されており、研究発表・制作物への転用時の扱い判断に直接使える。
- 概要:Power BI向けのデザインテンプレート(
メンタルモデル(AI・会話型インタフェース文脈)
- Schneider, J. (2025). Mental model shifts in human-LLM interactions. Journal of Intelligent Information Systems, 63, 1737–1752. https://link.springer.com/article/10.1007/s10844-025-00960-6
- 概要:20万件超の会話ログを計算言語学的手法で分析し、LLMとのやり取りを通じてユーザーのメンタルモデルがどう変化するかを実証的に調査。最初は「ソフトウェアツール」として扱っていたユーザーが、対話を経るにつれて人間同士の会話スタイルへ移行することを確認した。
- 関連性:「コマンドベース→インテントベース」への認知移行を実データで裏付ける証拠として直接使える。AIとの対話による認知変容のプロセスを理論化する起点になる。
- Luger, E. & Sellen, A. (2016). "Like Having a Really Bad PA": The Gulf between User Expectation and Experience of Conversational Agents. Proc. ACM CHI 2016. https://www.semanticscholar.org/paper/%22Like-Having-a-Really-Bad-PA%22:-The-Gulf-between-and-Luger-Sellen/814e62bb4f0ec6facd640fbd3e3fcbd189716d20
- 概要:音声エージェント(Siri等)の日常利用者14名へのインタビューから、ユーザーが持つメンタルモデルとエージェントの実能力との間に大きな乖離があることを明らかにした。エージェントのフィードバック不足が期待と体験のギャップを生む。
- 関連性:「母親メタファー」(理想のエージェント像)と現実のAIの差分から生じるUX上の欠陥を実証した先行研究。研究の核心的なフレームと直接対応する古典的な参照点。
- Norman, D. A. (1988). The Design of Everyday Things. Basic Books. ※改訂版2013.
- 概要:メンタルモデル・概念モデル・行為の7段階(ゴール形成→意図形成→行為詳細化→実行→知覚→解釈→評価)・実行のガルフ・評価のガルフを定式化したHCIの基礎的古典。デザイナーのモデル/システムイメージ/ユーザーモデルの三層構造を提示。
- 関連性:本研究の理論的骨格。「行為の7段階モデル」をAIインタラクション文脈に再解釈するための原典として必須。
認知負荷・エンビジョニング(LLM文脈でのノーマン理論拡張)
- Subramonyam, H., Pea, R., Pondoc, C., Agrawala, M., & Seifert, C. (2024). Bridging the Gulf of Envisioning: Cognitive Challenges in Prompt Based Interactions with LLMs. Proc. ACM CHI 2024. https://dl.acm.org/doi/10.1145/3613904.3642754 / arXiv: https://arxiv.org/abs/2309.14459
- 概要:ノーマンの「実行のガルフ・評価のガルフ」では捉えきれない、LLM操作特有の認知的課題として「エンビジョニングのガルフ(Gulf of Envisioning)」を提唱。ユーザーが①LLMにできることが分からない(能力ギャップ)、②どう指示すればいいか分からない(指示ギャップ)、③出力に何を期待すればいいか分からない(意図性ギャップ)という3つのミスアラインメントを定式化。
- 関連性:本研究の中核論点「認知負荷の移動・変質」を直接支持する最重要論文のひとつ。ノーマンの7段階モデルをAI時代に拡張する論拠として不可欠。
- Sensemaking of LLM Outputs at Scale. (2024). Supporting Sensemaking of Large Language Model Outputs at Scale. Proc. ACM CHI 2024. https://dl.acm.org/doi/10.1145/3613904.3642139
- 概要:LLMの出力に対するユーザーのセンスメイキング(意味の構築プロセス)を支援するテキスト分析アルゴリズムとUI設計を提案。アナロジカル学習理論に基づき、LLMの挙動についてのロバストなメンタルモデル形成を促す設計手法を示した。
- 関連性:ユーザーがAI出力をどう理解し、どうメンタルモデルを更新するかのプロセスに着目した実践的研究。AIとのインタラクションにおける「評価のガルフ」縮小設計の参考になる。
Human-AI Interaction(HAI)全般
- Amershi, S., Weld, D., Vorvoreanu, M., et al. (2019). Guidelines for Human-AI Interaction. Proc. ACM CHI 2019. https://dl.acm.org/doi/10.1145/3290605.3300233
- 概要:20年以上のHAI研究を統合し、AIシステムが初回インタラクション時・通常利用時・エラー時・経時変化に際してどう振る舞うべきかを規定する18のガイドラインを提示。49名のデザイン実務者による検証を経て策定。Microsoftが主導。
- 関連性:AIプロダクト設計の実務指針として現在も最も引用される文書。「プロダクト開発者・デザイナー向けの思考枠組み」を提示する本研究と直接対応する。
- Weisz, J. D., He, J., Muller, M., Hoefer, G., Miles, R., & Geyer, W. (2024). Design Principles for Generative AI Applications. Proc. ACM CHI 2024. https://dl.acm.org/doi/10.1145/3613904.3642466 / arXiv: https://arxiv.org/pdf/2401.14484
- 概要:Amershi et al. (2019) の枠組みを生成AIの特性(出力の可変性・共創性・不完全性)に合わせて拡張した6原則29戦略を提示。「適切な信頼とリライアンスのための設計」「生成可変性への設計」「共創への設計」等を含む。IBMリサーチによる実践的検証を経た成果。
- 関連性:生成AI UXに特化した最新の設計原則集。本研究の「プロダクト開発者・デザイナー向け思考枠組み」の比較対象・参照先として重要。
- Shneiderman, B. (2022). Human-Centered AI. Oxford University Press. https://global.oup.com/academic/product/human-centered-ai-9780192845290
- 概要:「高い人間コントロール」と「高い自動化」を二軸とする2次元HCAI(Human-Centered AI)フレームワークを提示し、信頼性・安全性・説明責任を確保しながら自律システムを設計する方法論を体系化。2023年PROSEアワード受賞。
- 関連性:AIエージェントの自律性とユーザーコントロールのバランスという本研究が扱うテーマの重要な理論的基盤。「エージェントへの委譲」が進む中でのUX設計論の出発点。
インテントベース・インタラクションとUIパラダイム転換
- Nielsen, J. (2023). AI: First New UI Paradigm in 60 Years. Nielsen Norman Group. https://www.nngroup.com/articles/ai-paradigm/
- 概要:コンピューティング60年以上の歴史の中でUIパラダイムは「バッチ処理」「GUIコマンド操作」に続き、「インテントベースアウトカム指定」が第3のパラダイムになったと論じる。ユーザーは「何をするか」ではなく「何が得たいか」を伝えるだけになる。2023年NNGの最多読み記事のひとつ。
- 概要と関連性:本研究の「コマンドベース→インテントベース」という中心的な問いを最も端的に言語化した実務寄りの一次資料。研究の出発点として引用必須。
- Designative (2025). Flows in the Age of Agentic AI: Our Core UX Models No Longer Apply? [https://www.designative.info/2025/11/20/flows-age-agentic-ai-what-if-our-core-ux-models-no-longer-apply/](https://www.designative.info/2025/11/20/flows-age-agentic-ai-what-if-our-core-ux-models-no longer-apply/)
- 概要:AIエージェントがステップを代行するようになると、従来の「ユーザーフロー」設計手法が機能しなくなると論じる。デザインの成果物が「フロー図」から「行動契約(behavioral contract)」へ移行すると予測。Human-Agent Centered Design (H-ACD) を提唱。
- 関連性:エージェントの台頭がデザイン実践そのものをどう変えるかを論じた実務寄り論考。本研究の「プロダクト開発プロセスの変化」という側面の考察に使える。
AIへの信頼・過剰依存・オートメーションバイアス
- Cau, M. et al. (2023). Measuring and Understanding Trust Calibrations for Automated Systems: A Survey of the State-Of-The-Art and Future Directions. Proc. ACM CHI 2023. https://dl.acm.org/doi/full/10.1145/3544548.3581197
- 概要:1000件以上の論文から96件を特定し、自動化システムへのトラスト・キャリブレーション(過信・過小信頼の是正)研究を包括的にサーベイ。適切なリライアンスの実現に向けた設計介入を整理。
- 関連性:ユーザーが「AIに任せすぎる」問題の理論的・実証的基盤。インテントベース化による認知負荷の新たな偏りを議論する際の参照点になる。
- Exploring automation bias in human–AI collaboration. (2025). AI & SOCIETY, Springer. https://link.springer.com/article/10.1007/s00146-025-02422-7
- 概要:医療・法律・行政など高リスク領域におけるオートメーションバイアス(AI推奨への過度な依存)を体系的にレビュー。説明可能AI(XAI)がバイアスを増幅するリスクも指摘。
- 関連性:AIへの意図委託が進む中でのユーザーの批判的判断能力の低下という問題を論じる際に有用。UX設計の責任論にも接続できる。
AIリテラシーとメンタルモデルの誤解
- Generative AI Literacy: A Comprehensive Framework for Literacy and Responsible Use. (2025). arXiv. https://arxiv.org/html/2504.19038v1
- 概要:生成AIリテラシーを「機能的リテラシー」「批判的リテラシー」「間接的便益リテラシー」の3観点で整理し、ブルームのタキソノミーと対応させた包括的フレームワークを提示。適切なメンタルモデル構築には技術的基礎理解が必要と論じる。
- 関連性:ユーザーの「AIへの誤ったメンタルモデル」の原因構造を分析する際に使える分類体系。AIリテラシーの欠如がインテントの言語化困難につながるというロジックの補強に使える。
- Exploring Human-LLM Conversations: Mental Models and the Originator of Toxicity. (2024). arXiv. https://arxiv.org/html/2407.05977
- 概要:人間とLLMの会話パターンを分析し、ユーザーのメンタルモデルが会話の性質(有益・有害・誤解を招く)にどう影響するかを調査。人間からLLMへの毒性の"起源"を探る観点も含む。
- 関連性:ユーザーのAIに対するメンタルモデルが対話品質を左右するというメカニズムの実証研究。意図伝達の質とメンタルモデルの関係を裏付ける。
設計原則・エージェントUX
- Smashing Magazine (2026). Designing For Agentic AI: Practical UX Patterns For Control, Consent, And Accountability. https://www.smashingmagazine.com/2026/02/designing-agentic-ai-practical-ux-patterns/
- 概要:AIエージェントがユーザーに代わってタスクを実行する環境向けに、コントロール・同意・説明責任のためのUXパターンを実践的にまとめたガイド記事。インターベンション・オーバーライド・自律度ダイヤルなどの設計パターンを紹介。
- 関連性:「エージェント時代のUX設計」の具体的手法を示す実務資料。本研究が提示するプロダクト開発者向け思考枠組みの実装例として参照できる。
- Subramonyam, H. et al. (2025). Agentic Workflows for Conversational Human-AI Interaction Design. arXiv. https://arxiv.org/html/2501.18002v1
- 概要:従来の直接操作インタフェース(ユーザーのメンタルモデルに合ったアフォーダンスを提供)とは対照的に、会話型HAIはゴール指定の負担をユーザーに移しつつタスク実行を自動化するというパラダイム転換を論じる。エージェントワークフローの設計フレームを提案。
- 関連性:「実行はAIが担い、ゴール言語化がユーザー負担になる」という本研究の核心命題を、インタラクション設計の観点から直接論じた論文。
日本語圏・関連動向
- JST/CRDS (2024). 俯瞰セミナー&ワークショップ報告書:人・AI共生社会のための基盤技術. 国立研究開発法人科学技術振興機構. https://www.jst.go.jp/crds/pdf/2024/WR/CRDS-FY2024-WR-08.pdf
- 概要:AIが「ツール型」から「自律エージェント型」に移行する段階において、人間側のメンタルモデル認識と共生設計が重要になるとまとめた国内ワークショップ報告書(2024年9〜10月開催)。世界モデル・認知科学的メンタルモデルとの接続も論じる。
- 関連性:日本語文脈でのAIエージェント×メンタルモデル論の公的・学術的な動向把握に有用。ゼミ資料での国内事情の引用に使える。
- 野村総合研究所 (2024). 日本のChatGPT利用動向(2024年9月時点). NRI. https://www.nri.com/jp/knowledge/report/20241016_1.html
- 概要:ChatGPTの国内認知率72.2%・利用率20.4%を報告。利用者の懸念として「回答が不正確」(47.7%)と「AIに頼って自分で考えなくなること」(39.6%)が上位を占める。
- 関連性:日本ユーザーのAI利用実態と認知的不安(過剰依存・批判的判断の低下)の定量データ。研究の背景・動機づけに使える。
ノーマン7段階モデルのLLM文脈適用
- Bhat, A., Shrivastava, D., & Guo, J. L. C. (2023). Approach Intelligent Writing Assistants Usability with Seven Stages of Action. arXiv / CHI 2023. https://arxiv.org/abs/2304.02822
- 概要:ノーマンの行為7段階モデルをLLMとのインタラクション設計に適用した立場論文。各段階をLLM利用文脈に読み替え(「行為の設定」→プロンプト指定、「実行」→LLM出力生成)、ライティング支援ツールの設計フレームワークとして提示。CHI 2023発表。
- 関連性:自分の「7段階モデルは構造不変・インスタンスが変わる」という解釈の直接の先行研究。設計提案 vs 理論的再解釈という差分を明確化する必要がある。
言語化負荷・認知負荷の低減(技術・設計アプローチ)
- Liao, Z., Liao, J., & Zhao, X. (2026). Prism: Towards Lowering User Cognitive Load in LLMs via Complex Intent Understanding. arXiv. https://arxiv.org/abs/2601.08653
- 概要:ユーザーの複雑な意図を論理的依存関係を持つ要素に分解・整理することで認知負荷を低減するフレームワーク「Prism」を提案。タスク完了時間34.8%短縮・ユーザー満足度14.4%向上を実証。認知負荷理論(CLT)に基づく。
- 関連性:「言語化負荷の低減」を技術的に解こうとする最前線研究。「言語化支援がデザイン課題になる」という仮説に対する工学的実装例として位置づけられる。
- Xu, J. et al. (2026). Overloaded Minds and Machines: A Cognitive Load Framework for Human-AI Symbiosis. Artificial Intelligence Review, Springer. https://link.springer.com/article/10.1007/s10462-026-11510-z
- 概要:人間の認知負荷理論とLLMのコンテキストウィンドウ制約を「有界エージェント補完性(bounded agent complementarity)」として統合するレビュー論文。両者が有界な作業空間を持つ処理器として類似した失敗をすることを示し、動的な負荷分散による協調設計を提案。
- 関連性:認知負荷理論のAI文脈への拡張として参照可能。ただし焦点は教育・医療ドメインで、UIデザインとの直接接続は薄い。
- Chelladurai, P. K. (2024). Beyond Conversations: Natural Language as Interaction Influencer. UX Collective. https://uxdesign.cc/beyond-conversations-natural-language-as-interaction-influencer-8b39ed123c39
- 概要:自然言語インターフェースがユーザーの認知・行動・期待に与える影響を実践的に論じるUX記事。オープンエンドなプロンプティングの認知的コスト(「50クレジット」問題)とチャット型UIの「Keyhole Effect」(視野の狭さによる空間記憶の失敗)などを指摘。
- 関連性:「言語化負荷」の実感に近い実践的記述として参照できる。学術論文ではないが、自分の仮説を補強するUX実践側の語彙として使える。
擬人化・期待の人間化
- Marchegiani, B. (2025). Anthropomorphism, False Beliefs, and Conversational AIs: How Chatbots Undermine Users' Autonomy. Journal of Applied Philosophy. https://onlinelibrary.wiley.com/doi/10.1111/japp.70008
- 概要:チャットボットへの擬人化的な誤信念(人間のように意識・意図があるという思い込み)がユーザーの自律性を損なうことを哲学的に論証。67%のユーザーがChatGPTに何らかの意識を帰属させているとの実証データを引用し、人間向けの行動規範をAIに誤適用する構造的リスクを指摘。
- 関連性:「期待の人間化」仮説の哲学的裏付け。AIが人間らしく振る舞うほどユーザーの期待が高度化し、ギャップが深まるという洞察に対して、その倫理的帰結(自律性の毀損)まで論じた文献として補強に使える。
OOUI・UIパラダイムの歴史的変遷
- 上野 学 (2016). OOUI – オブジェクトベースのUIモデリング. ソシオメディア. https://www.sociomedia.co.jp/7279
- 概要:GUIの本質はOOUI(オブジェクト指向UI)であるという立場から、タスクベースUIの問題点とオブジェクトベースへの転換手法を詳説。「名詞→動詞」の操作順序がモードレス設計の核心であり、タスクベース=モーダル=認知コスト高という構造を論証。IBM CUA(1989)・Dave Collins (1995)・Theo Mandel (1997)・OVID (1998) の系譜も整理されている。
- 関連性:「コマンドベース→インテントベース」転換の歴史的前提として直接使える。「名詞→動詞」構文はノーマンの7段階モデルと直接対応し、タスクベース=モーダル=認知負荷高という図式は本研究の「認知負荷の移行」論点の原型となる。AIエージェント時代の「行動契約設計」との比較軸にもなりうる。
AIネイティブ設計・デザイン実践の変容
- 3284 (2026). デザインシステムをAIネイティブにするとき、人は何を決めるとよいのか. note / Ubie. https://note.com/3284/n/nf1e73a1294ba
- 概要:Claude Codeが開発現場に定着した文脈で、デザインシステムをAI実行可能な仕様(Markdownファイル群)として構造化する実践を紹介。① review-design-system(コンポーネント仕様・デザイン原則のリファレンス)② ia-to-ui-pattern(情報設計→UIパターン変換)の2スキル構成。「When NOT to Use」の明示・抽象原則と具体的DO/DON'Tの二層構造・カバレッジ判定フライホイールが特徴。Coinbase CDS・Spotify Encoreを参照事例として引用。
- 関連性:デザイナーの暗黙知を「AIが実行可能な形式知」へ変換するプロセスが、本研究の「言語化支援のデザイン」「行動契約」の具体的実装例として直接参照できる。「人が意思を込める場所」「AIはシグナルを出し人が判断する」という役割分担の記述はエージェント時代のデザイン実践論に接続する。
プロダクトジョブ市場・デザイン職の変化
- Rachitsky, L. (2026). State of the product job market in early 2026. Lenny's Newsletter(TrueUpデータ使用). https://www.lennysnewsletter.com/p/state-of-the-product-job-market-in-ee9
- 概要:世界9,000社超のテック企業求人データを分析。PM求人数が3年超ぶりの最高水準・AIエンジニア求人が急増する一方、デザイン職の求人は2023年以降横ばいで推移。PM対デザイナーの比率が逆転(現在1.27倍でPMが優勢)。AIによってエンジニアが高速に動けるようになり、従来のデザインプロセスが省略されつつある可能性を示唆。ベイエリアのAI求人が全体の1/3を占める。
- 関連性:デザイン職が市場で相対的に縮小していることは「デザイナーの役割変化」「デザイン実践そのものの変容」の傍証として使える。エンジニアがAIで高速化する→従来のデザインプロセスが介在しにくくなる、という連鎖は「デザイン対象が操作UIから言語化支援・行動契約へシフトする」仮説と合わせて読める。
- Hill, B. K. (2023). デザインとは何か?その4つの役割とは. btrax / Freshtrax. https://blog.btrax.com/jp/what-is-design/
- 概要:デザインの役割を①可視化(情報・アイデア・ブランド・体験の可視化)②課題解決③導き(ユーザーを正しい方向へ誘導する)④シンプル化の4つに整理した実務寄りの解説記事。「デザインは見た目ではなくどう機能するか」(ジョブズ)「シンプルさは究極の洗練」(ダ・ヴィンチ)などの引用を交えながら、デザインの本質を言語化している。
- 関連性:「導き」と「シンプル化」の2役割が本研究と接続する。AIが実行を代替する時代に、デザインに残る役割として「ユーザーの意図言語化を支援する(=導く)」「複雑なインタラクションをシンプルに見せる」という方向性を論じる際の定義的な土台になる。また同著者(@brandonkhill)がLenny記事でも言及されており、デザイン職横ばい傾向への実務者視点の補足文脈として参照できる。
Critical Incident Technique / UX・HCIでの応用
- Flanagan, J. C. (1954). The Critical Incident Technique. Psychological Bulletin, 51(4), 327-357. https://www.apa.org/pubs/databases/psycinfo/cit-article.pdf
- 概要:クリティカル・インシデント法の原典。人間行動の直接観察を集め、実践上の問題解決や心理学的原理の構築に用いる手続きとして CIT を定式化した。
- 関連性:本研究で CIT を名乗る場合の基準になる文献。一般目標の設定、インシデント基準の明確化、データ収集、分類、解釈という流れを確認する必要がある。
- Nielsen Norman Group (n.d.). The Critical Incident Technique in UX. NN/g. https://www.nngroup.com/articles/critical-incident-technique/
- 概要:CIT を、参加者に特定の行動・出来事が成果に正負の影響を与えた具体的な場面を想起・記述してもらう UX リサーチ手法として解説。肯定・否定のインシデント、質問設計、記憶バイアス、典型利用を代表しない限界にも触れる。
- 関連性:AI 介在型実践において、成功・失敗・違和感・修復の場面を具体的に記録する方法の参考になる。今の記録フォーマットの「正負のインシデント」「具体的な出来事」条件を補強する。
- AHRQ Digital Healthcare Research (n.d.). Critical Incident Technique. Agency for Healthcare Research and Quality. https://digital.ahrq.gov/health-it-tools-and-resources/evaluation-resources/workflow-assessment-health-it-toolkit/all-workflow-tools/critical-incident-technique
- 概要:CIT を複雑システムにおけるオペレーターの意思決定を理解する方法として説明。インシデントの選定、出来事の記録、タイムライン構築、分析対象点の選択、プローブによる深掘りという手順を示す。
- 関連性:本研究で「ワークフロー上の位置」「人間の判断・評価」「修復」を扱う際に有用。特に、インシデントの時系列と認知的詳細を記録する必要性を示している。
- UX24/7 (2024). UXリサーチにおけるクリティカル・インシデント手法. UX24/7. https://ux247.com/ja/critical-incident-technique/
- 概要:CIT を、記憶に残る出来事を観察し、特定の人間行動が結果に与える影響を分析する質的研究手法として日本語で解説。具体的なインシデント、因果関係、肯定・否定の出来事、質問設計、バイアスや想起限界を説明する。
- 関連性:日本語で研究説明・ゼミ説明を行う際の導入資料として使いやすい。AI 利用場面における「判断・違和感・修復が結果にどう影響したか」を問う設計に接続できる。
- Methods for User Experience (n.d.). Critical Incident Technique for User Experience. Methods for UX. https://methods.uxp.ie/criticalincidents.php
- 概要:UX評価における CIT の実施手順を説明。具体的なインシデント、前後の文脈、成果への影響を記述させ、肯定的・否定的インシデントを収集し、カードソートや内容分析で分類する流れを示す。
- 関連性:本研究の記録フォーマットにおける「前後の文脈」「成果への影響」「肯定・否定の両方」「分類・分析」の不足確認に有用。
- FitzGerald, K., Seale, N. S., Kerins, C. A., & McElvaney, R. (2008). The critical incident technique: a useful tool for conducting qualitative research. Journal of Dental Education. https://pubmed.ncbi.nlm.nih.gov/18316534/
- 概要:CIT を保健医療・教育領域で使われる柔軟な質的研究手法として整理。観察者による事実報告を集めることで、アネクドートをデータ化できると説明する。
- 関連性:AI利用の個別エピソードを単なる逸話で終わらせず、記録・分類・横断分析によって研究データへ変換する考え方を補強する。
- Critical incident technique as a qualitative research method (2001). PubMed. https://pubmed.ncbi.nlm.nih.gov/11665387/
- 概要:CIT を質的研究方法として扱う際には、Flanagan の前提と自分の研究方法を照合し、現象学・グラウンデッドセオリー・解釈学など他の方法との適合も比較すべきだと述べる。
- 関連性:本研究で CIT を使う妥当性を検討する際の注意点になる。CIT が本当に問いに合っているか、また他の質的手法とどう違うかを説明する必要がある。