WEKO3
アイテム
報酬に基づく協調問題解決のための注目点の獲得に関する研究
http://hdl.handle.net/10212/2311
http://hdl.handle.net/10212/2311289b64b3-46cb-4d9f-8356-f9cea01fd73d
| 名前 / ファイル | ライセンス | アクション |
|---|---|---|
|
|
|
|
|
|
|
| Item type | 学位論文 / Thesis or Dissertation(1) | |||||||||
|---|---|---|---|---|---|---|---|---|---|---|
| 公開日 | 2017-09-01 | |||||||||
| タイトル | ||||||||||
| タイトル | 報酬に基づく協調問題解決のための注目点の獲得に関する研究 | |||||||||
| 言語 | ja | |||||||||
| その他のタイトル | ||||||||||
| その他のタイトル | Research on the Acquisition of Attention Points for CooperativeProblem Solving Based on Rewards | |||||||||
| 言語 | en | |||||||||
| 作成者 |
坂戸, 達陽
× 坂戸, 達陽
|
|||||||||
| アクセス権 | ||||||||||
| アクセス権 | open access | |||||||||
| アクセス権URI | http://purl.org/coar/access_right/c_abf2 | |||||||||
| 主題 | ||||||||||
| 言語 | ja | |||||||||
| 主題Scheme | Other | |||||||||
| 主題 | モジュール型モデル | |||||||||
| 主題 | ||||||||||
| 言語 | ja | |||||||||
| 主題Scheme | Other | |||||||||
| 主題 | 強化学習 | |||||||||
| 主題 | ||||||||||
| 言語 | ja | |||||||||
| 主題Scheme | Other | |||||||||
| 主題 | インタラクション | |||||||||
| 内容記述 | ||||||||||
| 内容記述タイプ | Abstract | |||||||||
| 内容記述 | 将来,各家庭にロボットが導入される日も遠くないと言われている.日常生活の場において人の手助けを目的とするロボットには,日常生活における様々な場面で起こる様々な状況に対応する能力が求められるが,起こり得るすべての状況を想定してロボットの動作を予め組み込んでおくことは困難である.よって,日常生活の場で活動するロボットには,インタラクションを通して,置かれている環境や他者に適応する能力が必要である.しかし,ロボットが特定の課題を達成する際,実世界の環境から得られる情報には,課題の達成とは関係のない情報も多い.また,複雑な処理を行うロボットは,内部で扱う記号間の関係性や,記号自体の意味を,環境に適した形で獲得する必要がある.さらに,様々な状況に対応するロボットは,特定の状況に対応するロボットよりも多くの機能を持っていると考えられるが,特定の課題を達成する際には必要とされない機能も多いはずである.よって,ロボットが実世界で学習する際には,環境から得られる情報から必要な情報を選択すること,そして,ロボットのもつ機能の中から,課題の達成に必要な機能を選択することが要求される. 本論文では,ロボットなどの学習エージェントが獲得する報酬に着目し,学習エージェントが課題の達成に必要な情報や機能などの要素を選択するための注目点を獲得するモデルを,(i)外部情報,(ii)内部表象,(iii)内部処理の3つの観点から提案する.課題はそれぞれ,模倣学習,見立て遊び,協調行動という課題を用いる.課題には他者とのインタラクションを含め,協調問題解決のための注目点の獲得モデルを提案する.外部情報の注目点の獲得では,模倣学習における注目対象を獲得するモデルを提案する.ロボットなどの学習エージェントの学習手法の1つとして,試行錯誤による学習が挙げられるが,探索空間の広い環境においては,試行錯誤による学習のみでは,学習に多くの時間がかかり実用的ではない.そこで,すでに達成すべきタスクに習熟している他者を模倣することで効率的に学習することが考えられるが,このような模倣学習における問題の1つとして,他者の行動のどの要素に注目するかということが挙げられる.本論文では,模倣学習において観測した他者の行動の何に注目するかという,模倣学習における注目対象を獲得するモデルを提案する.シミュレーション環境でのタスクとしては食卓上でのインタラクションを扱い,実世界のロボットでのタスクとしては塗り動作を扱う.実験の結果,提案モデルでの学習で,タスクに対して適切な注目対象を獲得することができた. 内部表象の注目点の獲得では,見立て遊びにおける学習エージェントの内的表象を獲得するモデルを提案する.知的エージェントのモデルの1つとして,認識,計画,実行などの機能ごとのモジュールの組み合わせによって複雑な問題を解決しようとするモデルがある.このモデルでは,モジュールの組み合わせを変えることで,異なる環境や状況に学習結果を再利用することができる.本論文では,インタラクションとして学習エージェントと他者との見立てを含む真似遊びを扱い,インタラクションを通して物体間の関係性を学習し,他者に伝わる見立てを行うための物体の表象を獲得するモデルおよび,各機能モジュール間の関係性を学習し,意図の表象を獲得するモデルを提案する.タスクとしては,見立ての獲得,他者に伝わる見立ての獲得,見立てを含む真似遊びにおける意図の表象の獲得を扱う.実験の結果,学習エージェントは,それぞれのタスクに対して提案したモデルで適切な学習を行うことができた. 内部処理の注目点の獲得では,他者意図の推定に基づく協調行動を獲得するモデルを提案する.ロボットが人の手助けを目的とする場合,人の意図を推測し,推測した意図に基づいた協調行動を行う能力が必要である.本論文では,モジュール型のモデルを用いた,他者意図の推定に基づく協調行動を獲得するモデルを提案する.タスクとしては積み木遊びを扱い,モジュールの組み合わせによって協調行動を獲得するモデルを提案する.実験の結果,学習エージェントは与えられたタスクにおける協調行動に必要なモジュールの組み合わせ方を学習し,他者と協力してタスクを達成することができた. | |||||||||
| 言語 | ja | |||||||||
| 日付 | ||||||||||
| 日付 | 2016-03-25 | |||||||||
| 日付タイプ | Issued | |||||||||
| 言語 | ||||||||||
| 言語 | jpn | |||||||||
| 資源タイプ | ||||||||||
| 資源タイプ識別子 | http://purl.org/coar/resource_type/c_db06 | |||||||||
| 資源タイプ | doctoral thesis | |||||||||
| 学位授与番号 | ||||||||||
| 学位授与番号 | 甲第785号 | |||||||||
| 学位名 | ||||||||||
| 言語 | ja | |||||||||
| 学位名 | 博士(工学) | |||||||||
| 学位授与年月日 | ||||||||||
| 学位授与年月日 | 2016-03-25 | |||||||||
| 学位授与機関 | ||||||||||
| 学位授与機関識別子Scheme | kakenhi | |||||||||
| 学位授与機関識別子 | 14303 | |||||||||
| 言語 | ja | |||||||||
| 学位授与機関名 | 京都工芸繊維大学 | |||||||||