製品の開発や設計に関わる人間の特性について、心理学の観点から紹介していきます。

1. マジカルナンバー: 7±2

 人間が一度に覚えることのできる情報量は 「7±2」 の範囲と言われています。これは、アメリカの心理学者G.A.Millerが1956年に 「The magical number seven, plus or minus two: Some limits on capacity for processing information」 という論文で発表し、現在では人間の情報処理の特徴として広く知られています。

  「7±2」 の範囲を調べる実験は、実験者がランダムにひとつづつ数字を読みあげ、読み上げ終わったあとに、読み上げられた順番どおりに被験者に数字を言ってもらう( 復唱 )というものです。読み上げられた数が9個以上になると、その正答率は50%以下に減少してしまうことが分かっています。

例( 0と1の数字をランダムに読み上げる場合 )

 数列 復唱
( 1 )01100110 ( うん、楽勝! )
( 2 )10010111001011 ( なんとか言える )
( 3 )101101001001101101001?? ( ダメだ、もう分からない )

 この 「7±2」 の単位は 「チャンク」 と言われ、情報のまとまりを意味します。例えば、 「CVG」 や 「KQM」 などの意味のないつづりは3チャンクですが、 「NTT」 や 「IBM」 などは1チャンクと考えられます。

 先の0と1のランダムな数列も、チャンク化する手段を用いると7つ以上の数字を記憶することが容易になります。( 3 )の 「101101001001」 という12個の数列の場合、2つの数字を一つのまとまりと考え 「10/11/01/00/10/01」 の2進数表記と捉えると、 「231021」 の6チャンクに変換できます。6チャンクは 「7±2」 の範囲に入っていますから、 「231021」 と覚えることは容易で、思い出すときにはそれを展開して 「101101001001」 とすればよいわけです。

 この 「7±2」 は人間の知覚にもあてはまります。一度にどのぐらいのものを見ることができるかを調べるために、コンピュータディスプレイ上にごく短い時間ランダムにドットを配して数えさせるという実験でも、表示されるドットの数が 「7±2」 の範囲ではほぼ正確に知覚でき、それ以上になると正答率は減少することが分かっています。

 このように、人間が一度に( 一時的に )扱うことのできる情報量の上限が 「7±2」 チャンクであることが心理学実験により確かめられています。

 日常の生活の中にもこの 「7±2」 が見られます。例えば、虹のように連続的な色の変化をしているものでも、われわれは 「7色」 ととらえますし、音階のドレミファソラシドも周波数を7つに分けてとらえています。また、 「世界の七不思議」 、 「七つの海」 、 「春の七草」 等々の表現もあり、7つ程度をひとつのまとまりとして把握することが人間にとっては妥当であるといえます。

 ソフトウェアのユーザビリティの観点から、ワードやエクセルのプルダウンメニューを調べてみました。プルダウンメニューを表示させてみると、選択項目は一つのメニューにつき15から20ぐらいが上限でした。しかし、それぞれの項目はその機能毎に横罫線で区切られており、その区切りをひとつのまとまりとすると 「7±2」 を超えることはなく、同じようにそれぞれの区切り内の項目数も 「7±2」 を超えることはないようです。普段は気にも留めませんが、人間の情報処理能力の制約が反映されているといえます。

 シュナイダーマンのユーザビリティ原則 のひとつである 「8.ユーザの短期記憶負担を少なくする」 や、 画面設計原則の 「効率性」 にある 「人間が一時的に覚えられる事項( 短期記憶領域 )は7つが限度で、この負担を減らさなければなりません。」 なども、このような背景に基づいています。


2. ジャーゴン

 失語症という言語障害があります。これは、脳の言語に関する部位が何らかの損傷を受けることが原因で、発話ができても文法的に正しくなかったり、言葉の意味は理解していても流暢に発話できなくなったり、という症状を示します。例えば、後者の例では 「テレビ」 と言おうとしているのに 「タデビ」 と発話されたりします。失語症の患者さんの発する意味不明の言葉は 「ジャーゴン:Jargon」 と呼ばれ、まわりの人には理解できません。

 失語症の世界に限らず、その分野の人にしか理解できない難解な用語などは、一般の人からすればジャーゴンとなります。例えば、ブラウザのエラーメッセージに、

サーバの DNS 項目がありません
  接続がピアーによってリセットされました  
404 アクセスできません

などがありますが、ネットワークやコンピュータに明るくない人にとってこれらはジャーゴンです。

 最近の新聞広告で、以下のようなコンピュータのダイアログボックスが表示され、

その上に大きな文字で
「わたしに宇宙語で話しかけないで!」
と書いてあるものがありました。コンピュータ関連出版社の宣伝広告ですが、ついうなずいてしまいます。

 ジャーゴンを発する失語症の患者さんとわれわれがコミュニケーションをとろうと思っても、お互いスムーズに意思の疎通を図ることは難しいでしょう。これは、ユーザインターフェイスの世界にもそのままあてはまります。ソフトウェアの使用中にヘルプを開いたら専門用語ばかりで、またその専門用語を調べる羽目になったなどはよく聞かれる例です。

 専門的な領域で専門家たちが、あるいは限定された領域で限定された人たちがコミュニケーションする場合には問題となりませんが、広く一般ユーザが使用する製品の場合には気をつけなければなりません。単に言葉の意味が分からない、分かりにくいという程度かもしれませんが、ユーザの側からすれば 「システムから拒絶された、受け入れられない」 という心理的傾向を引き起こす原因にもなります。

 システムや製品の中に専門用語が多用されていないかどうか、あるいは専門用語が用いられていたとしてもヘルプなどで適切に解説されているかどうかは、ユーザビリティ評価の基本的なチェックポイントとなります。


3. ユーザの主体性

 ユーザビリティに関する、 ニールセンやシュナイダーマンの原則 の中に以下のようなものがあります。
  ユーザが自由に制御できる( ニールセン )
  ユーザに主体的な制御権を与える( シュナイダーマン )

 これらは、ユーザが主体的にシステムを 「使用する / できる」 ことの重要性を述べていますが、なぜこのような主張が原則として取り上げられるのでしょうか。

 セリグマンという心理学者が非常に興味深い実験をしています。彼は、イヌを被験体とした条件づけの実験をしました。条件づけとは、生体にある条件の元では特定の決まった行動をさせるようにするもので、水族館でのイルカやアシカのショウなどにはこのテクニックが応用されています。

 まず、シャトルボックスと呼ばれる実験用のカゴを用意し、その中にイヌを入れます。シャトルボックスは、2つの部屋があり行き来できるようになっています。また、足元( 床 )には微弱な電流が流れるようなしかけが施されています。このような環境の中で、ブザーの音が鳴ると、イヌがその時にいる方の部屋の床にのみ電流が流れるようにしておき、音を鳴らして電流を流すということを繰り返し行います( 図1 )。

図1.シャトルボックス

 イヌは当然電流を嫌がりますので、逃げようとして動き回ります。徐々に、部屋を移ること( 隣の部屋に行くこと )により電流を避けられることを学習し、最終的にはイヌはブザーの音が鳴っただけで部屋を移動するようになります。このような状態が条件づけの成立で、イヌが電流を避けることを 「学習」 したといいます。

 一方、今度はやや残酷ですが、別のイヌにシャトルボックスの部屋の間に仕切りをして移動できないようにします。そのような状態で同じことを行うと、イヌははじめは同様に電流から逃れようと右往左往しますが、どうあがいても電流からは逃れられませんので、最後には観念して部屋の角にうずくまってしまい、ブザーの音に関係なく自発的な行動をやめてしまいます。
 後者の経験をさせられたイヌに対して、今度はシャトルボックスの仕切りを取り払ってみても( つまり逃げ道をつくってあげても )、このイヌは相変わらず同じ場所を動こうとしないことが観察されています。

 セリグマンは、このような後者のイヌの行動・状況を 「自分が何をやってもだめだ」 という 「無力感・絶望感」 を 「学習」 した状態と考え、 「学習性無力感( 学習性絶望感 ):Learned Helplessness」 と呼びました。この概念は人間にもあてはまり、心因性うつ病などの発症要因としても考えられています。

 ユーザビリティの観点からみると、例えば何度操作しても使い方が覚えられなかったり、何度同じことをやっても思うように行かなかったりという状況は、それがユーザのうっかりミスや勘違いであったとしても、上記の部屋をしきられてしまったイヌと同じといえます。そのような経験が続けば続くほど無力感や絶望感を味わうことになり、ユーザの精神的ストレスにつながりますし、新たに解決の糸口が見える状況が出現したとしても、自ら行動を起こさなくなってしまいます。

 このような事態を避けるために必要になるのが、行動に対する適切なフィードバックです。はじめの ユーザビリティ原則 の2つ以外にも、例えば、

  システムの状態を視覚的にフィードバックする( ニールセン )
  有益なフィードバックを提供する( シュナイダーマン )
  段階的な達成感を与える( シュナイダーマン )

などがあり、これらは主体的にユーザが使用するための適切な手がかり( フィードバック )の必要性を指摘していると考えられます。

 ユーザが、システムから適切なフィードバックを受け取り、主体的にシステムを操作するという当たり前のことが実はとても重要です。


4. 図と地

 われわれはものを見る際に、その対象を 「図」 と 「地」 に分けて捉えます。図( figure )とは、その対象の中のもっとも意味ある領域で、例えばスナップ写真を見ているとすれば、そこに写っている人の姿や顔などです。これに対し、地( ground )はそれらの背景にある風景などに相当します。
 文章を読む場合でも、文字そのものが 「図」 で背景部分が 「地」 に相当します。 「図」 は意味を持ちますが、 「地」 は意味を持ちません。コンピュータのディスプレイにも当然 「図と地」 が存在します。ウィンドウが開いていない状態のデスクトップは 「地」 でしょうし、その上に置かれているアイコンやフォルダなどは 「図」 になります。

 以下の図形は何に見えるでしょうか?( 図1 )

図1.??

 一見するとただの黒いブロックのような図形が並んでいるだけですが、黒い部分にはさまれた白い部分に着目してください。 「THE」 という文字を見ることができるはずです。普段われわれは多くの場合、白い背景に黒い文字が書かれているものを目にする経験をしており、それに基づくと、 「THE」 とすぐには認識できません。ここでは、図と地を反転させて見る必要があります。

 このような見えの特徴として、一度固定した見方をしてしまうとその見え方がその後も持続することが知られています。一度、意味のある 「THE」 が見えてしまうと、その後に無意味なブロック図形を見ようとしても、意識的に見る努力をしないとなかなか見えてきません。

 次の例は、世田谷区にある公園で見つけたものですが、何を示しているものかすぐに理解できるでしょうか。にっこり微笑んでいる人の顔のようにも見えますし、遠目から見るとチューリップの花( ? )のようにも見えますが、実はトイレを示すマーク( アイコン )です。そういわれて見直すと中央部分が便器の形をしています( 図2 )。
 このマークは、人の顔なのかトイレを表す形なのかにより、図と地が反転します。一般的に、対象の中心部には 「図」 があり、その周辺領域に 「地」 が存在するわけですが、この例では、トイレの形を示している本来 「図」 になるべき部分が、背景の本来 「地」 となるべき部分と連続した同じ領域として扱われているため( 緑の領域 )、見た瞬間に 「地」 と判断されやすいわけです。逆に、中心部にある白い領域が人の顔を示す 「図」 として見えてしまいます。

図2.公園で見つけた顔?

 先の例と比較して、こちらは図と地を反転させて交互に見ることが容易に行えると思います。つまり、人の顔を見ようと思えば人の顔が見えますし、便器の形を見ようと思えばそれが見えます。これは、お互いの境界が明確で、どちらも見る側のわれわれにとって意味のある 「図」 になりうるからです( 「THE」 の例ではTHEしか意味がありません )。  このような図形や絵は 「多義図形」 と呼ばれ、見る側の人間に対してある種の 「楽しさ」 を提供しているように思います。笑顔のマークも、小さな子どもが利用することの多い公園ならではの工夫なのかもしれません。

 コンピュータディスプレイやウェブページの背景などが、大げさな写真やイラストなどで飾られていたりすると、その上に重なっているアイコンや文字などは見づらくなります。どちらも意味を持った 「図」 になるので、お互いがうまく分離されるような工夫が必要になります。


5. 再生と再認

 人が何かを記憶してそれを思い出すとき( 想起するとき )には、思い出し方によって 「再生( recall )」 と 「再認( recognition )」 に分けられます。どちらも思い出すという点では同じなのですが、心理学の実験などでは厳密に両者は区別されます。

 ある記憶課題を与えた後に、何も手がかりがない状態で思い出す場合は 「再生」 です。一方、 「この中から先ほど覚えたものを選んでください」 、あるいは 「これはありましたか」 というような状況で思い出す場合は 「再認」 となります。例えば、りんごやみかんなどの果物の写真を複数枚記憶刺激として用意し1枚ずつ見せます。その後、 「先ほど見たものを思い出してください」 という教示を与えて、被験者が 「えーと、りんご。それから、~」 といって思い出すのが 「再生」 です。一方、 「先ほど見た中にこれはありましたか」 といって果物の写真を1枚ずつ見せていき、 「あった・なかった」 を答える場合などは 「再認」 となります。前者を 「再生法」 、後者を 「再認法」 と呼びます。  より日常的な例( ? )では、仮にあなたが事件を目撃したとします。警察から、犯人の似顔絵を作成するので顔を思い出すようにと言われた場合は 「再生」 になります。何枚かの顔写真を見せられ、その中に犯人がいるかどうかを問われた場合は 「再認」 となります。

  「再生法」 と 「再認法」 とで、どのぐらい記憶成績が異なるかを比較すると、当然ですが何の手がかりもない状態で思い出さなければならない 「再生法」 の方が、 「再認法」 に比べて成績は下がります。しかし、これを大人と子どもとで比較した場合、 「再生法」 では明確な差( 大人の方が子どもより多く思い出せる )があるのに対して、 「再認法」 では大人も子どもも差がないと言われています。記憶への負担は 「再認」 の方が断然少ないわけです。

 コンピュータのインターフェイスが現在のようなGUI中心になるまでは、毎回コマンドをキーボードから入力しなければなしませんでした。毎回必要なコマンドを自分の頭の中にある記憶( 知識 )から 「再生」 しなければならなかったわけです( 図1 )。それに対して、メニューから必要なものを選択して実行させるというやり方はコマンドを 「再認」 させており( 図2 )、こちらの方が記憶への負担はより少なくてすみます。( 図2の場合は 「終了」 という言葉の再認とともに位置の記憶( 一番左のメニューの一番下 )も機能します。 )

図1 再生によるインターフェイス
図2 再認によるインターフェイス

 このような 「再生」 と 「再認」 の違いは、そのまま人間の知識の在り方にも関わっています。 「誰のためのデザイン」 の著者であるノーマンは、これらを 「頭の中の知識( knowledge in the head )」 と 「外界にある知識( knowledge in the world )」 と呼び分け、インターフェイス設計時に有効に活用する必要があると述べています。  自分の頭の中からすぐ取り出せる( つまりいつでも再生可能な状態で保持されている )情報は 「内的知識( 頭の中の知識 )」 であり、手がかりがあればそれを取り出せる状況( つまり再認可能な状態 )での情報は、 「外的知識( 外界にある知識 )」 です。カレンダーや手帳に予定を書き込んだり、メモを冷蔵庫に張り付けておいたりという行為は、自分の頭の 「中」 ではなく 「外」 に情報を置くことによって、記憶への負担を減らしている好例です。

 しかし、情報をどういった形で外においておくかということは重要になります。単に何かの印( サイン )だけではうまく 「再認」 できないこともありえます。例えば、手帳に予定を書き込む際に、スペース節約のためにアルファベットの頭文字で記入していたとします。ところが、いざ手帳を開いたときにその頭文字の意味がわからない( 忘れてしまった )、予定があるのはわかるけれどもそれが何なのかが思い出せない、などということは往々にして起こり得ます。

  「再認」 をうまく利用できる( あるいは利用させる )ような、インターフェイス設計が望まれます。


6. スキーマ

 少々長いですが、以下の文章を読んで何について書かれているものか考えてみてください。

 その手順はまったく簡単である。まず、ものをいくつかのグループに分ける。もちろんひとまとめでもよいが、それはやらなければならないものの量による。もし設備がないためどこか別の場所に行かなければならない場合には、それが次の段階となる。そうでない場合は、準備はかなりよく整ったことになる。重要なことはやりすぎないことだ。すなわち、一度に多くやりすぎるよりも少なすぎる方がよい。このことの重要性はすぐにはわからないかもしれないが、面倒なことがすぐに起こりやすいのだ。その上、失敗は高価なものにつく。
 最初は、その全体の手順は複雑に思えるかもしれない。しかし、すぐにそれは生活のほんの一部になるだろう。近い将来この仕事の必要性がなくなるとは予想しにくいが、誰も何とも言えない。その手順がすべて終わったあとで、ものを再びいくつかのグループに分けて整理する。次にそれらは適当な場所にしまわれる。結局、それらは再び使用され、その全体のサイクルは繰り返されることになる。ともかく、それは生活の一部なのである。

( ブランスフォード&ジョンソン、戸田他訳、1986 )

 さて、文章を読んでみて何について書かれているものか分かったでしょうか。おそらく理解できた方は少ないと思います。ところが、上の文章が 「洗濯の仕方を記述したもの」 と教示を受けた場合はどうでしょうか。そう思ってもう一度読み返してみてください、すんなりと文章の内容が頭に入ってくるはずです。

 この例は、単にひとつひとつの文章の意味を把握できても、それが直接文章全体の理解にはつながらないことを示しています。われわれは自分の持っている様々な知識に照らして 「意味」 を解釈していきますが、ここでは照らし合わせるべき知識がどのような類のものなのかという手がかりがないため、文章全体を理解することができません。この照らし合わせるべき知識の集合を 「スキーマ( schema )」 といいます。

  「スキーマ」 とは経験により蓄積された知識の集まりで、物事に対する 「図式」 とか 「枠組み」 などと訳されます。適切なスキーマを適切な状況下で活性化させることができなければ、対象を 「理解」 することは困難になります。逆に、適切なスキーマが活性化されれば、その対象に対する理解は一段と容易になるでしょうし、その状況下で 「どういう手順で何をしなければならないのか」 という理解も促進されます。

 われわれの日常生活では、多くのスキーマに依存した行動が取られています。例えば、電車に乗るために券売機で切符を買うという行為の場合、お金を入れて、目的の切符のボタンを押し、切符を手に入れますが、この一連の行為に迷うことはまずありません。これは電車の券売機に限ったことではなく、自動販売機全般について当てはまるスキーマとなっていますので、自動販売機で何か買う場合でも同様に迷うことはありません。

 しかし、券売機も多様化・複雑化しており、タッチパネル式の場合、パネル表面の押し間違え( うっかり別の個所を触ってしまうなど )を防ぐために、はじめにボタンを押して、次に当該分のお金を入れるということも可能になっているようです。注意して見ると、券売機の上部や横に 「目的地までの金額のボタンを押してからお金を入れてください。」 と表示がある場合もありますが、果たしてどれほどの人がその手順で切符を買っているのか気になるところではあります。

  「使いやすい」 ということには、あらかじめわれわれが持っている何らかのスキーマをうまく利用できる、あるいは利用できるような仕掛けが施されているということも重要となるでしょう( ただし、ユーザにとってそれらは意識に上りません )。また逆に、参照すべきスキーマが見つからない場合や、なぜそうしなければならないかという理由が理解されないまま、すでに持っているスキーマから外れる行為をしなければならない場合などは、 「わかりにくい・使いにくい」 と判断されるのかもしれません。


7. アフォーダンス

  「アフォーダンス( affordance )」 という言葉がよく聞かれるようになってきました。なかなか明確な定義が見当たらないのですが、意味するところは 「そのものの形や状態が、自然にわれわれの行動・行為を引き出すこと」 となります。われわれが外界を知覚する際に、対象の物理的な特性を知覚するのではなく、 「対象が与えてくれる特性を知覚する」 あるいは 「外界の情報がわれわれに特定の行動を喚起させる」 という考え方です。

 よく引き合いに出される例が 「ドア」 です。ドア( その取っ手など )を見たときに、そのドアを押して開ければよいのか引いて開ければよいのかが、スムースにわれわれ( ユーザ )に伝わってくるかどうかという点から、そのドアのアフォーダンスが評価されます。判断に迷うようなドアは、それに続くわれわれの行為をうまくひきだしていない( アフォードしていない )とされます。

 テレビ番組に、監視カメラが捕えた面白映像を紹介するものが時々ありますが、銀行に押し入り逃げようとしている強盗が、ドアに何度体当たりしても開かないというのを見たことがあります。手前に引けば開くというドアのアフォーダンスが強烈なものであれば、こっけいな姿をさらさずにすんだかもしれません。ただし、この場合の強盗は極度のパニック状態にあると思われるので、適切な状況把握が困難だったことの方が大きな原因かもしれません。

 コンピュータディスプレイ上に表示されるソフトウェアの場合でも同様で、GUIのボタン表示が典型です。ボタン状に見える凹凸のついた四角形があれば、それをマウスでクリックすること( 押せるということ )をアフォードします。もし凹凸のついていない領域だけの四角形であれば、ボタンとは判断されにくいでしょう。図1はウェブページに表示されるバナー広告の例ですが、ドロップダウンリストボックスや検索ボタンなどを表示し、いかにもそこで操作が出来そうな印象をユーザに与えています。このような 「見え」 につられて、誰しもつい一度はボタンを押してしまったという経験があるのではないでしょうか。

図1.バナー広告の例

 この 「アフォーダンス」 は、伝統的な心理学における知覚理論に対して疑問を持ったギブソンという心理学者が提唱した考えで、その背後には 「生態学的妥当性( ecological validity )」 という概念があります。ギブソンは従来の実験室のような特殊で限定的で人工的な環境下での知覚というものに疑問をもち、より自然でダイナミックな環境下で知覚を捉えなければ、本来の知覚を説明することはできないと考えていました 【 注 】

 日常生活では多くの場合、人間のからだが静止することはなく、むしろ動くことによって外界の情報を収集していると考えられます。 「見る」 という行為は、われわれ自身が動くことによりまわりの包囲光を変化させ、その変化から明らかになる 「不変項( invariant )」 をピックアップしていることであるとギブソンは考えています。これらはまた、環境の知覚を成立させるとともに、その環境を知覚している観察者自身の知覚( 自己の知覚 )ともなり得ます。動くことにより得た自分自身についての情報( 自己の知覚 )をもとにして、例えば 「机の上の本に手を伸ばせば届くかどうか」 や、 「手を使わずに座れる椅子かどうか」 などの知覚が発生すると考えられます。 「通り抜けられる隙間」 のようなアフォーダンスの概念は、このような背景を元にしています。

 とはいえ、 「アフォーダンス」 に関してはまだまだ誤解もあるようです。そのひとつが、アフォーダンスとは 「反応」 を引き出すための単なる 「刺激」 ではないのかというものです。しかし、日本のアフォーダンス研究の第一人者である佐々木氏によれば、 「刺激」 と決定的に異なるのは、 「刺激」 がほとんど無条件にわれわれの行動を引き出すのに対して、アフォーダンスが利用される場合、時間の長短はあれ必ず 「探索」 の過程が観察されるということです( 佐々木、1994 )。アフォーダンスは、刺激のように 「押しつけられる」 のではなく、知覚者が 「獲得し」 「発見する」 ものであるということが強調されています。

 アフォーダンスの逆の利用の仕方もあります。ユーザにとってほしくない行動を誘発させないように、意図的に逆のアフォーダンスを使うというものです。例えば、クルマの給油口などは、その個所からは開けることが出来ないことをアフォードしています。開けるためには指を入れるためのくぼみあるいは取っ手が必要ですが、そのようなものは一切ありません。これらは、 「何が出来ないか」 を示している 「制約」 となります。

 アフォーダンスがうまく働いている場合、ユーザはごく自然にその対象を使用する( 操作する )ことが可能となります。アフォーダンスと制約の両者をよく考えてデザインに利用すれば、全く新しい場面でもユーザが直ちに適切な行為を行えるようにすることができます( ノーマン、1990 )。


【 注 】
 ここで従来の実験室のような特殊な環境といっているのは、心理学がかかえる方法論上の問題点でもあります。心理学は 「こころ」 という目に見えないものを対象とした 「科学」 でなければならないという前提から、その現象の 「客観性」 「再現性」 が非常に重視されます。そのために、現実世界の多くの情報は排除されるべき 「ノイズ」 として扱う必要がありました。
 例えば 「奥行きの知覚」 を調べる際に、視力検査の機械のように被験者の頭とあごを固定し、光の一切ない実験室の中で目の前の暗闇に写し出される光点までの距離を答えさせる、というようなやりかたをしており、そのような日常生活とかけはなれた不自然な状況を指しています。
 しかし、ギブソンの主張を契機に、そのような日常生活とかけはなれた状況は明らかに不自然であり、そのような不自然な状況から人間を研究しても生態学的には妥当ではない、という認識が多くの研究者の中で持たれるようになってきました。



8. イメージ

 われわれは、車を運転しながら音楽を聴いたりラジオを聞いたりすることができます。しかし、運転をしながら、頭の中で詰め将棋を解いたりすることはおそらくできないでしょう。この2つの違いは、単に頭の中で行わなければならないことの難易度が影響しているのでしょうか。これらは、視覚や聴覚などの感覚モダリティが違うものを同時にイメージする( 処理する )ことが困難であることに原因があります。

 具体的な実験をご紹介します。実際に被験者になったつもりで実験場面を想像してみてください。



タスク1:
 まず、左下の図形( Mの形 )を見て形を覚えてください( 図1 )。覚えたならば図を見ずに、図形の左下の×印から矢印方向にスタートして、図の外周を一巡する動きをイメージしてください。その時、外側を向いている角にきたときに 「Yes」 、内側を向いている角にきたときに 「No」 と声に出して言いながら一巡してください。そのようにして、一周するのにかかる時間を測定します。

 ※正解は 「Yes」 「Yes」 「No」 「Yes」 「Yes」 「Yes」 「Yes」 「No」 「Yes」 「Yes」 「No」 「Yes」 「Yes」 になります。

タスク2:
 タスク1と同じですが、 「Yes」 「No」 と声に出して答える代わりに、以下のようなシート上( 図2 )で 「Y」 や 「N」 の記号を指差しながら頭の中で一巡してください。同様に時間を測定します。

図1.頭の中にイメージする図形 図2.指差しで答えるためのシート

タスク3:
 今度は、図形を覚える代わりに以下の文章( 図3 )を覚えてください。そして、覚えたならば、暗唱しながら、順に単語が名詞であれば 「Yes」 それ以外であれば 「No」 と声に出して言ってください。同様に時間を測定します。

図3.頭の中で暗唱する文章

 ※正解は 「No」 「Yes」 「No」 「No」 「Yes」 「No」 「No」 「No」 「No」 「Yes」 になります。

タスク4:
 タスク3と同じですが、 「Yes」 「No」 と声に出して答える代わりに、先ほどのシート上( 図2 )で記号を指差しながら暗唱してください。同様に時間を測定します。



 以上のタスクの遂行時間を比較したものが図4です。イメージする対象が図形の場合には 「指差し」 で答えるのに時間がかかり、逆に対象が文章の場合は 「発声」 で答えるのに時間がかかっています。実際に自分でやってみても同様の傾向になることを確認できると思います。
 図形( タスク1、2 )の場合、頭の中には視覚的な空間イメージが保持されているので、空間上で行う 「指差し」 と競合します。逆に 「発声」 で答える場合は、そのような空間イメージを必要としないので競合が起こりません。この逆がタスク3、4です。
 タスク2と3は、同じ感覚モダリティによるイメージの競合が起こるため、タスクの遂行に時間がかかっているわけです。

図4.タスク遂行にかかる時間



 より日常的な場面では、例えば自分で小説を読む場合と他人の朗読を聞く場合とを比べた場合、特に写実的な内容の時は、他人の朗読を聞く方が内容の視覚的光景をイメージしやすいという経験はないでしょうか。朗読を聞く場合、本のページ内に配置されている文字を視覚的にたどる必要がないため、その分内容の視覚的イメージが生成されやすくなると考えられます。
 また、最近は情報アプライアンスという言葉が一般的になってきましたが、例えばカーナビゲーションシステムでは、運転中の視覚的な空間イメージとカーナビゲーションからの情報が競合しないような提示の仕方が工夫されなければなりません。

 インターフェイス設計を考える際にも、このようなヒューマンファクターに配慮する必要があるでしょう。


9. 機能的固着

 ちょっとしたクイズです。容量の異なる3つのビンがあり、それらを使ってある量の水を測りたいのですがどのようにすればよいでしょうか。3つのビンの容量と求めたい水の量とが以下のようになっています( 表1 )。6パターンありますが、上から順にトライしてみてください。
表1.ビンの容量と求めたい水の量( Luchins,1946 )
No.ビンAビンBビンC求めたい水の量
21127100
141632599
184310
4221
205931
287625

 4つの数字を見比べながら考えれば、ビンBからビンA1回分とビンC2回分の水を引けば求めたい水の量になることに思い当たると思います。1番目から5番目までは同様の計算で解くことができます。
 6番目で少々戸惑った方が多いのではないでしょうか。6番目に対しても同様の計算方法を適用してみた方は多いと思います。しかし、それでは答えが出ないので、初心に返って4つの数字を見比べてみると、単にビンAからビンC1回分の水を引けばよいことが分かります。なーんだと思われたかもしれません。

 人は一度あるタスクを解決するための方法を学習すると、その後も同様の方法で事に当たろうとする傾向があります。これは、ある種の課題に対する 「心的構え( mental set )」 が成立したことを示しています。この 「心的構え」 はそれ自体問題ではなく、新奇なあるいは以前経験したことのある似たような場面などでの問題解決では有効と考えられます。 ( 第6回スキーマ参照 )
 しかし、ひとつの解決方法にのみこだわってしまい、問題解決ができない状態に陥ることもよく起こり、これは 「機能的固着( functional fixedness )」 と呼ばれます。

 機能的固着は、誤操作( エラー )をした場合などに多く見られ、その操作方法が間違っているにも関わらず繰り返し同じ方法でなんとかしようとしてしまいます。ユーザが、間違った方法であるということに気づき、なぜ間違っているのかを論理的に見つけ出すという行動がとれるかどうかがポイントになります。特に、ユーザが高齢者の場合などはそのような論理的な判断によるエラーの回避が難しく、同一行動の反復というような機能的固着が起こりやすいといわれています。

 このような機能的固着はユーザの知識や経験に依存する場合が多く、インターフェイス設計だけでは簡単に回避できないかもしれません。しかし、そのシステムの 「エラーに対する寛容さ」 や 「操作の冗長性を高める」 といった 「ユニバーサルデザイン」 の観点からアプローチすることによって、軽減できるのではないでしょうか。


10. 単純接触効果

 写真に写っている自分の顔を見て違和感を感じたことはないでしょうか。何がどう変だと言葉では説明しにくいのですが、なんとなくいつもの顔と違うなという感じをふと抱くことがあります。これは、普段は鏡に映った自分の姿を目にする回数が多く、他人から見た自分の姿に慣れていないことが原因です。

 対人魅力研究など社会心理学の領域から発生した知見で、 「単純接触効果( mere exposure effect )」 というものがあります。これは、 「ある対象に接触する回数が増えればその対象への好意が増大する」 という非常にシンプルなものです。例えば、小学校で隣の席に座った子を好きになりやすいとか、選挙前に貼り出される顔と名前がやたらに目立つポスターなど、この 「単純接触効果」 が関係していると考えられます。

 実験によって 「単純接触効果」 を検証した例があります。ある人の普通の顔写真と、それを裏返しにしてプリントした写真( 鏡映像 )の2種類を用意します( 図1 )。それを、その写真の本人と本人をよく知る友人や家族などに見せて、どちらの写真が好きかを聞きます。先の効果によれば、見慣れた方( つまり接触回数の多い方 )をよく好むことになりますので、本人であれば裏返しにプリントされた写真( 鏡映像 )を好み、友人や家族は普通の写真の方を好むという結果が予想されます。実際に、本人は裏返しにプリントされた方を、友人・家族は普通のプリントの方を好むという結果になったそうです。

 
図1.顔写真( 左側が通常、右側が鏡映像 )

 この顔写真の実験は、普段の日常生活の中でも確認することが出来ます。ある程度大きさのある鏡の前に、自分と友人のふたりで並んで立ち、お互いの顔を見比べてみてください。自分はいつも通りの顔をしていますが、友人の顔は普段見なれたのとはどこか違って見えるはずです。面白いのは、隣にいる友人もまた同じことを感じているということです。

 このような 「単純接触効果」 は、対象が人間だけでなくモノや漢字・数字などでも生じることが確認されており、かなり一般的に認められる効果であるとみなされています。単純な 「慣れ」 というレベルから対象に対するいわば 「好意・魅力」 という次元にまで影響が及んでしまうことは、普段それが意識に上らないという点でも興味深いと思われます。

 われわれが日常的に使っているコンピュータやソフトウェアアプリケーション、ウェブの画面などにも、多かれ少なかれこのような 「単純接触効果」 が生じています。それを使ったことのない人の目には 「おかしい、変だ」 と映る問題も、当事者にとっては問題と認識されないということがあります。むしろ、それが( そこが )好きなんだという事態さえ生じることも予想されます。ユーザビリティの高い製品であるためには、客観的な他人の視点からモノを見直すというプロセスを経ていくことが必要です。


11. まとまりを見る

 人間は対象を知覚する際、その構成要素同士の関係などからある種の 「まとまり」 を捉えます。この 「まとまり」 がうみだされる要因としては、 「ゲシュタルトの法則( law of gestalt )」 が知られており、以下のような5つの要因として整理されています。ちなみに 「ゲシュタルト( Gestalt )」 とはドイツ語で 「形態」 とか 「まとまり」 などの意味です。

■ 同じ形、同じ色、同じ大きさなどは、ひとつのまとまりとして知覚されやすい:類同の要因( factor of similarity )

表1.類同の要因
左の図形は同じ形が縦に並んでおり、縦の列のまとまりが知覚できます。
一方、右の図形は青と緑の色により横の行がまとまりとして知覚できます。
電卓やテレビのリモコンのキーの配置などに、身近な例を見ることができます。

■ 距離が近いものが、ひとつのまとまりとして知覚されやすい:近接の要因( factor of proximity )

表2.近接の要因
丸、三角、四角というように個々の要素の形が違っていても、距離が近いことによってひとつのまとまりを形成しています。
デスクトップですが、右側にアイコンの小さなまとまりがあります。また、左側には多くのアイコンが固まってまとまりを形成しています。このまとまりは近接の要因のほかにも、要素の大きさが均等であることなどの類同の要因も考えられます。

■ 閉じられた空間に配置されているもの( 相互に閉じた関係にあるもの )は、ひとつのまとまりとして知覚されやすい:閉合の要因( factor of closure )

表3.閉合の要因
「かぎかっこ」 により閉じられた空間をひとつのまとまりとして知覚できます。また、完全に閉じられていなくともその部分を補完し、距離が離れたもの同士でもひとつのまとまりとして知覚することができます。
ブラウザのフレーム表示のように、閉じられたいくつかの空間はひとつのまとまりとして知覚されます。
基本的に、ディスプレイ上のウィンドウ表示は、それぞれがひとつのウィンドウとして閉じられた空間という性質を持ち、また次の 「良い連続」 した形をし、あるいは 「共通運命」 であるので、堅固なまとまりがつくられます。

■ 連続性のあるものは、ひとつのまとまりとして知覚されやすい:良い連続の要因( factor of good continuation )

表4.良い連続の要因
左の図形は通常ふたつの正方形が重なり合ったものとして知覚します。右側の下のような図形が組み合わさったものとして知覚することはありません。正方形という連続した形をひとつのまとまりとして知覚しているためです。
タブダイアログなども、タブの上部の形態の連続性により、背後に重なり合ったひとつのまとまりを知覚できるようになっています

■ 同じ動きをするものは、ひとつのまとまりとして知覚されやすい:共通運命の要因( factor of common fate )

表5.共通運命の要因
同じタイミングで同じ方向に動くことによって、それらをまとまりとして捉えることができます。それにより左の例では、意味のないランダムな文字群の中から意味を知覚することができます。

 このような 「まとまり」 を知覚するゲシュタルトの基本的な成立要因は、一般的に視野に与えられた図形や図形群が、そのときの条件の許す範囲で、全体としてもっとも単純で、もっとも規則的で、安定した秩序のある形にまとまろうとする傾向を持っているためと考えられます( このことをプレグナンツの法則と呼びます )。逆に、そのような知覚をすることが人間にとって認知的に負担の少ない 「自然なものの見方」 といえます。

 また、これらは 「見る」 という視覚に限定された話しではありません。 「聞く、あるいは聴く」 という聴覚においても、同様の傾向が当てはまります。例えば、音楽を聞く際に、われわれは個々の音という要素を単に知覚しているわけではなく、メロディや和音といったある種のまとまりを上記の各要因を通じ捉え、単独ではそれ自体あまり意味のない 「音」 を越えた 「音楽」 という全体を知覚しているといえます。 「全体の性質は個々の総和の結果ではない」 というのがゲシュタルトのポイントです。多くの機能を持つソフトやハードの製品、またいろいろなコンテンツを持つウェブサイトなどにも、このゲシュタルトの考え方が適用できるのではないでしょうか。


12. 認知地図

  「認知地図( cognitive map )」 という研究領域があります。これは、人間の思考の特徴や知識の形態を 「地図」 というメタファから探ろうというものですが、例えば次の問題を考えてみてください。

鎌倉の大仏と島根の出雲大社とでは、どちらが北に位置しているでしょうか?
パナマ運河の西側の口は、太平洋でしょうか大西洋でしょうか?

 それぞれ 「鎌倉の大仏」 「太平洋」 が正解と考えがちですが、実際はどちらも逆ですこれらは、頭の中で理解している空間の認識と現実とが異なっているために起こります( 図1 )。

図1.日本とパナマの地図( 上下:北南、左右:西東 )

 このような観点から、実際の地図と心の中の地図( 認知地図 )の比較をするために、被験者に身の回りの地図を描いてもらうということを心理学ではよく行います。例えば、自分の所属する学校の地図などを描いてもらいます。すると、多かれ少なかれ現実の地図とは異なった部分が出てきます。複数の人に共通の特徴( 現実の地図との差異 )が認められる場合は、それがその環境で生活する人々の一般的な理解・知識であると考えられます。

 試みに、社内の何名かにK工場の地図を書いてもらいました( 図2 )。


事例1

事例2

事例3
図2.K工場の描画事例

 共通する特徴としては、いずれもJR南武線が左右に伸びそれに沿った形でK工場の敷地が描かれており、左手中央付近に本館、中央の上方にに東7番館が位置しています。 「事例3」 では線路と並行ではなくやや左( 西側 )に敷地が傾いています。また、いずれも上を北にした地図となっており、北を向いた視点で描かれています。
 ( 注:地図の中には 「MN駅、本館、東7番館」 を含むように教示しましたが、その際に 「知らない人に道案内をするように」 との旨を付け加えてしまいましたので、全体の位置関係がややデフォルメされてしまったかもしれません。 )

 では、実際のK工場はどのようになっているのでしょうか。図3左がほぼ実際の環境と同じ地図です、本来はもっと線路の角度がきつくなっています( 図3右写真 )。これと先の事例を比較した場合のもっとも大きな相違点は、南武線とK工場の敷地との関係です。実際は、南武線は東西に伸びてはおらず、北西から南東に斜めに延びています。そして、K工場の敷地はその斜めの線の上に 「台形」 として位置していますが、われわれの認知地図はそのようにはなっていません。

図3.K工場の実際の地図と写真( 上下:北南、左右:西東 )

 認知地図は環境を正確には反映しておらず、むしろ実際の環境とはかなり違う形で保持されているといえます。認知地図の構成要素やその形成過程の特徴については別の回にゆずりますが、製品を使用する際に( また使用しながら )形成されるユーザの 「概念モデル」 を考える上で参考になる部分が多いと思われます。例えば、自分と異なる方向の認知地図を持っている人に口頭で道案内する場合の難しさは容易に想像できますが、これらは製品のヘルプやマニュアルの表現方法、あるいはウェブサイトの構成やナビゲーションなどを考えることと同様の問題と見ることもできます。


13. 認知地図:その2

 前回 「認知地図」 に関する話題を取り上げましたが、今回は認知地図の構成要素や作成されるプロセスについて考えてみたいと思います。

■構成要素

 そもそも実環境を正確に反映した認知地図が形成されることは少なく、多くの部分で個人に都合がいいようにゆがめられて保持されています( 第12回参照 )。では、どのような情報が保持されているのでしょうか。多くの場合以下の5つに整理でき、これらが認知地図の構成要素として知られています。表1にはK工場での具体例を挙げてみました。

表1.認知地図の構成要素
構成要素内容具体例( K工場 )
パス進むことのできる道すじ・正門から北門までの道路
・建物内部の廊下など
エッジイメージにある2つの局面の境目・建物と道路の境目
・庭と道路の境目など
ディストリクト二次元的広がりを持ったもので、
共通のひとつの特徴を持ち、
まとまりとして認識される
・植木や芝生の植えられた庭
・駐車場
・各建物など
ノードパスが交差する焦点・正門を工場側に入った地点( 左右に分かれる )
・正門から北門に至るパスと東門から本館東側入り口に向かうパスとの交差点など
ランドマークイメージの中で目立つ
特徴的な目印
・( どこからでも見える )本館
・池
・煙突など

 製品を 「使う」 という行為は、 「ある種の認知地図を内的に持ち、そこでの構成要素を手がかりに進んでいく」 というメタファで考えることが出来ます。適切な経路を示してくれるはずの道案内や道路標識があいまいであったり複雑であったりすれば、目的地までたどりつくことができず迷ってしまうように、それぞれの構成要素を適切に区別し( パス、エッジ、ノードの認識 )役割を明確にする( ディストリクトの認識 )ことが 「使いやすさ」 、特にアプリケーションの 「操作性」 、ウェブのナビゲーション、またマニュアルなどの情報の 「検索性」 などにとっては大事な点だと思われます。

 認知心理学者の海保氏によれば、マニュアル( 取扱説明書 )からエラーが誘発される原因には3つあるそうです( 海保他、1996 )。そのうちのひとつが 「( 必要な情報が )どこに書かれているかがわからない」 というもので、調査の結果、 「目次から情報を探せない」 、 「大切なところとそうでないところの区別がつかない」 の2つが主なユーザの不満としてあるそうです。製品のマニュアル・ヘルプなども、人の製品に対する認知地図形成を効率よく促進させるような視点で書かれているべきだと感じます。

■作成のプロセス

 次に、ユーザはそのような構成要素への接触から、徐々にその環境の認知地図を形成していきます。そのプロセスには、以下のようなものがあります( 表2 )。

表2.作成のプロセス
 プロセス具体例
イメージがまず通いなれた動線に沿って形成され、
次に外に向かって発展していく。
・自宅から駅までの道筋とその周辺地域
全体の輪郭がまずできあがり、
それから中心に向かって埋められていく。
・島や半島などの地域
・デパートのような建物内部の構造、構成
基本的な繰り返し模様からはじまって、
それから細部が付け加えられていく。
・碁盤状の街並
・スーパー、コンビニなどの売場
隣り合った地域がいくつか描かれ、
さらに相互の連続状態や地域内部のことが描かれる。
・複数の店舗などが入っているビルやデパートのフロア
馴染み深く密度の高い核から出発して、
他のものがこれに結び付けられる。
・駅や商店街などを起点としたその周辺地域

 このようなパターンは、構成要素の場合と同様にモノを 「使う」 プロセスまたはモノを 「使うことを学習する」 プロセスとして見ることもできます。多くの場合、 「A」 や 「E」 のように、自分がよく接する道筋や起点を中心として、徐々に細部の情報が付加され精緻化されます。 「C」 のパターンはやや特殊ですが、例えば複数のページが同じレイアウトでできているウェブサイトなどが当てはまるかもしれません。

 地図というメタファーで使いやすさを考えた場合、 「道に迷わない」 ということと、 「地図を形成する( 持っている )」 ということとは区別する必要があると思います。前者( 構成要素の認知 )は、その場での問題がクリアされるだけですが、後者( 認知地図の形成 )は 「知識」 の蓄積につながります。現実的には、その場の問題さえクリアされればよいともいえますが、後者のレベルまで見据えた 「使いやすさ」 を考えたいものです。


14. 問題を表現する

 次の 「15ゲーム」 問題を考えてみてください。

Question: 「1」 から 「9」 までの9つの数字があります。ゲームのプレーヤーは交互にひとつずつ数字を選び、選んだ数字のうちの、3つの合計が先に 「15」 になった方が勝ちです( 一度選ばれた数字をもう一度選ぶことはできません )。ゲームを開始すると次のような展開になりました。プレーヤーAが 「8」 を取り、プレーヤーBが 「2」 を取る。Aが 「4」 を取り、Bが 「3」 を取る。Aが 「5」 をとり…。
 さて、次にBは何を取るのが最善でしょうか?
Answer:答えは、今Aには 「8、4、5」 があり、Bに 「2、3」 があるわけですから、Aの 「15=4+5+?」 を阻止するために 「6」 をとる必要があります。すでに 「8+4+( 3 )」 「8+5+( 2 )」 は阻止済みです。ここでは、 「B自身が勝つのではなく、Aに勝たせないという戦略を取らなければなりません。

 この問題では、それぞれのプレーヤーがどの数字を取ったのかを記憶しておかなければなりませんし、その上でAが勝つ場合とBが勝つ場合の両方を考えなければなりません。これらにかかる心的な負荷は相当です。

 次の 「三目並べ」 問題はいかがでしょうか。
Question:プレーヤーAが 「×」 、プレーヤーBが 「○」 です。次の局面でBが石を置かなければならないところはどこでしょうか?
Answer:一目瞭然で右下角と分かります。この問題では、何も覚える必要はなく、単に空間的な配置のみに着目すれば自ずと答えが導かれます。

 ところで、先の 「15ゲーム」 は、以下のように縦横斜めすべての列の合計が15になるように数値を配してみると、先の 「三目並べ」 と原理的には同じであることがわかります( 図1の左図 )。このような図にしてみると、当然Bは 「6」 をとるでしょうし、次にAは 「7」 をとらなければ負けてしまうという判断が空間配置から容易に行えます( 図1の右図、丸で囲まれた方がB )。

図1.ます目の上に配置された数字

 このような問題は 「同型問題」 といわれます。2つがまったく違う問題のように見えても構造は実は同じというものです。 「思考」 や 「問題解決」 を扱う認知心理学の領域では、これ以外にも多くの例が示されています。いずれにしても、われわれにとって 「ある表現のもとではとても難しい問題が、別の表現では簡単に解けてしまう」 ということがあることを示しています。

 ユーザビリティ評価の中で同じような事例がありました。大型プリンタで用紙圧を調整するレバー( スカッフローラ )位置の指示ラベルをどう表現するかというものです。ユーザは、印刷する用紙の 「幅」 と 「坪量」 の2つから適切な位置にレバーを合わせなければなりません。

 ユーザビリティ評価前は、以下のようなラベルが作成されていました( 図2 )。

図2.評価前のラベル

 図2では、 「レバーの位置」 を起点として 「用紙の幅」 と 「坪量」 が同一行に置かれた表として表現されています。これでも使えないことはありませんが、同じ幅が2箇所あったりと、一目でどの位置にセットすればよいかの判断は難しくなっています。
 そこで次のような改善案が考えられました( 図3 )。

図3.評価後のラベル

 この図3では、用紙幅と坪量のマトリックスで表現されていますから、縦横それぞれがぶつかった個所の位置にセットすればよいというスムースな判断が可能です。もちろんそれ以外にも、数字と単位のフォントサイズを変えたり、用紙幅を図でも表現するなどの見やすさの工夫もされています。

 図2のラベルはまさに設計者・開発者の視点から作成されたもので、実際のユーザの視点に立つと図3のラベルの方が断然自然な判断を下すことができ効率もよいと思われます。レバーの位置を合わせるというタスク( 問題 )でもその表現により使いやすさは大きく変わるわけです。


15. 文脈効果

 ものの見方は、そのものが置かれている文脈や状況の影響を大きく受けます。下の 「THE CAT」 の 「H」 と 「A」 は物理的には同じ形状をしていますが、単語の一部になると、それぞれ異なった文字として知覚されます( 図1 )。

図1.THE CAT

 名刺の下には電子メールアドレスが記載されていますが、以前 「~@psl.mof.go.jp」 の 「psl」 が 「ps1」 に見えてしまい、何度メールを送っても届かないという指摘がありました。確かに見ようによっては数字の 「1」 と見ることもできます( 図2 )。メールアドレスの直前に書かれている 「e-mail」 の中にも 「l」 がありますが、 「e-mail」 というひとつのカテゴリとして認知するために、読み違えるということはありません。

図2.名刺のアドレス表記

 聴覚の場合の例もあります。次のような文章の最初の1文字に、ノイズを付加し聴こえにくくして被験者に提示します。

    「○んじの会議が開かれた。( 臨時 )」
    「○んじ速度が速いプリンタです。( 印字 )」
    「○んじのおやつは何にしようかな。( 3時 )」

「○んじ」 という単語はこれ以外にも複数存在しますが、被験者は後に続く文章から最初の1文字目を推測し文章の意味を読み取る・聞き取ることができます。

 これらは 「文脈効果」 とよばれ、日常会話場面などで頻繁に体験しています。話し手の言葉が部分的に聞き取れなくとも何を言っているかは分かるという経験は誰しもあることだと思います。

  「文脈」 は、人間の情報処理においてトップダウン型の処理を導きます。トップダウン型の処理とは、対象の細部に基づいて( ボトムアップ的に )全体を知覚するのではなく、自分自身の知識や過去の経験に基づいてそれに即した情報処理を行うことを指します。
 トップダウン処理の利点は、認知に必要なリソースを減らし処理の効率を高めるということにあります。つまり、文脈を利用することによって、いちいちひとつひとつの情報に注意を向けずとも全体を理解することができるわけです。

 ユーザビリティの高い製品は 「直感的に操作」 できます。アフォーダンスやスキーマなどもそうですが、トップダウン的に操作ができることは、その製品を効率よく使用することにつながります。ユーザ自身が置かれている文脈を理解し、 「今ここで何をどうすればよいのか」 が直感的に分かるようなインターフェイスが理想的です。

 ウィンドウズのオンラインヘルプでの操作事例を示します。 「bmp」 という用語をキーワードから調べようと思い、キーワードで 「.bmpファイル」 を選択しました( 図3 )。

図3.ヘルプ画面

 ここで 「表示」 というボタンをクリックすれば、その内容が右側のウィンドウに表示されると推測できますが、実際にクリックすると次のような少々ジャーゴンとも思えるメッセージが返されました( 図4 )。

図4.返されたメッセージ

 本来は、 「.bmpファイル」 という言葉の下にある項目( 「ペイント」 や 「壁紙として」 など )を選択してからでないと内容が表示されません。 「対象を選択して( ハイライト表示 )、それに対する操作を行う( 表示ボタン押下 )」 という文脈を利用し操作したつもりですが、この場合は適切な結果が得られませんでした。


16. 第一印象

 われわれは、どのようにして対象に対する印象を形成するのでしょうか。社会心理学では、特に人の性格( パーソナリティ )を対象とした 「印象形成( Impression Formation )」 の研究が古くから行われてきました。

 例えば、ある架空の人を想定し、その人に対する印象形成のされ方を調べる実験があります。手順は簡単で、例えば 「知的な、勤勉な、」 などの性格特性をあらわすいくつかの形容詞を、刺激語リストとして順番に被験者に提示します。その後、被験者は提示された形容詞に基づいて、その人の印象を答えます。刺激語の提示は、一語ずつ時系列に沿って提示しますので、全体を後から見直すことはできません。

刺激語リスト
[ 知的な ][ 勤勉な ][ 衝動的な ][ 批判力のある ][ 強情な ][ 嫉妬深い ]

 このような実験の結果次のようなことが分かっています。
  • 刺激語それぞれが相互に影響し合いながら全体的な印象が形成される。
  • 与えられた刺激語にも中心的な役割を持つものがある。例えば「暖かい、冷たい」など。
  • 刺激語の提示順序が影響する。
 この中で面白いのが3番目の結果です。先の刺激語リストをそのままの順番で提示した場合、全体としては 「よい」 印象が持たれますが、逆に提示した場合( つまり、[ 嫉妬深い ] → [ 強情な ] → といった順番で )、全体としては 「よくない」 印象が持たれます。これは 「初頭効果( primary effect )」 と呼ばれ、リストでのはじめの方の言葉が判断に影響を与えるという、いわゆる 「第一印象」 が影響していることを示しています。

 また、例えば 「Aさんは、神経質だけれど几帳面だ。」 という場合と、 「Aさんは、几帳面だけれど神経質だ。」 という場合では、Aさんの印象は逆になることが実感できます。前者はどちらかといえばよいイメージが喚起されやすいと思われますが、後者ではそれが逆転し多少ネガティブなイメージが喚起されやすいと思われます。ちなみにこの例では、 「親近性効果( recency effect )」 が働いているといえ、これは先ほどの初頭効果と逆の効果です。

 これら 「初頭効果」 「親近性効果」 は、単純な単語の記憶実験からも確認されています。単語の再生実験を行う際に、先ほどのように時系列で刺激語を提示した場合、一般的にリストのはじめと終わりの方の刺激語が、中間部分の刺激語と比べ再生率が向上します。これは、系列位置効果と呼ばれ、われわれ人間の 「短期記憶」 「長期記憶」 の存在を示す結果として解釈可能です【 注 】。このような記憶実験から、 「第一印象は記憶に残りやすい」 ということが確認できます。

 第一印象がよければそれでよしというほど単純ではありませんが、ぱっと見たときに 「使いやすそうだ!」 あるいは 「使えそうだ!」 と思わせることは、戦略的にも重要でしょう。また、得てして第一印象は記憶に残りやすいともいえるのです。

■追記■

 ユーザビリティ関連の情報を発信している 「U-Site」 というサイトで次のような記事を見つけました。 「先進事例レポート」 として、金沢工業大学の小松原先生がインタビューを受けています。

Q:具体的にはどのような研究を進められているのですか?

A:最近の例でいいますと、ライオンさんと共同で高齢者に対して、日用品パッケージのユーザビリティ評価を行いました。高齢者の日用品パッケージを使用する際の行動( 歯ブラシの開封や液体洗剤詰め替え作業、ボトル型容器、トリガー型容器からの液体洗剤の計量作業など )を観察、分析しました。

A:観察・分析を通していくつか興味深いことがわかりました。まず、外観の使いにくそうな感じが使用以前のバリアとなっていることがわかりました。高齢者だけに限ったことではないかもしれませんが、特徴的だったのは、外観をみて 「扱いにくそう」 という印象を持ってしまうと、使い出す気が起こらず、使いにくい製品だと判断してしまうということが分かりました。実際に使ってみてからの使いやすさも重要ですが、見た目の使いやすさというのも大変に重要な要素となっているということですね。

http://www.usability.gr.jp/report/200106.html より引用

【 注 】
   右図の横軸は刺激語の提示される順番で、縦軸がその語の再生率です。仮想的な図ですが、多くの場合このようなU字型の曲線が描かれ 「系列位置曲線」 として心理学の分野では良く知られています。

 時間的に先に提示されたものの再生成績がよい( 初頭効果 )のは、リハーサル( 単語を何度も口に出して言ってみること )などの記憶方略により、情報が 「長期記憶」 として保持されたためと考えられます。逆に、時間的に後に提示されたものの再生成績がよい( 親近性効果 )のは、再生を開始する直前に提示されているために時間的に近接しており、情報がまだ 「短期記憶」 として保持されているためと結論づけることが可能です。刺激語の提示後すぐに再生をさせるのではなく、一定時間( 20秒ぐらい )間隔を空けて再生させると、この 「親近性効果」 はみられなくなります。つまり、短期記憶の時間的制約である15~20秒という情報の保持時間を超えてしまうためです。しかし、この場合でも依然として 「初頭効果」 は認められます。


17. 文言の影響

 人間の記憶がいかにあいまいであるかを示す研究に、目撃者の記憶に関するものがあります。目撃者の記憶に関する心理学的研究は、裁判が日常的であるアメリカにおいて盛んに行われてきました。以下のような実験がよく知られています。

 まず、交通事故をシミュレートし自動車同士が交差点でぶつかる映像を用意します。そして、それを被験者に見せて、事故の瞬間の車のスピードはどれぐらいだったかを答えてもらいます( 実験開始時にこの目的は知らされていません )。その際、被験者は5群に分けられ、以下のような質問を受けます。

  • A群:クルマが激突した( smashed )とき、どのぐらいのスピードで走っていましたか?

  • B群:クルマが衝突した( collided )とき、どのぐらいのスピードで走っていましたか?

  • C群:クルマがぶつかった( bumped )とき、どのぐらいのスピードで走っていましたか?

  • D群:クルマが当たった( hit )とき、どのぐらいのスピードで走っていましたか?

  • E群:クルマが接触した( contacted )とき、どのぐらいのスピードで走っていましたか?


 見た映像は同じものですが、質問中に出てくることばが、それぞれ異なります。判断された平均スピードはA群がもっとも速く( 65.7km/h )、順にB( 63.2km/h )、C( 61.3km/h )、D( 54.7km/h )、E群( 51.2km/h )と遅くなりました。

 このような研究は、目撃者の 「証言のあいまいさ」 、 「人の記憶のあいまいさ」 を示しており、質問の仕方( 表現 )次第で、状況判断を含んだ対象に対する認識も影響を受ける( つまり質問形式の違いによって記憶の再構成化が生じる )という事実を示しています。

 これを、ユーザインターフェイスの問題として捉えなおしてみるとどうでしょう。多くの場面では言葉を介して行われますが、単にボタン上の文字だけの場合もあれば、注意書きのような文章である場合、あるいは機械による音声の場合など多様です。

 ある自動会計システムを評価したときの例ですが、精算をしようと思い機器にカードを挿入すると、 「精算がありません」 という音声メッセージが返されました。別にどうということのないメッセージで、現実的には問題とはならないでしょう。しかし、この表現は、機器の側が内部的に 「精算の対象となる処理が存在しない」 という意味で、単に 「精算がありません」 と答えを返しただけに思えます。たった一字ですが 「精算はありません」 とした方が、今目の前に立っているユーザを意識した表現( 前を向いた応答 )となる気がしますがいかがでしょうか。

 また、最近よく目にするようになってきた検索サイトで 「Google」 というものがありますが、このサイトでは検索ボタンが2つあります。ひとつは通常の検索を行う 「Google検索」 ボタンで、もうひとつは 「I'm Feeling Lucky」 というボタンです。後者のボタンは、英語ですし、また英語であっても 「名称から機能が予測できない」 というユーザビリティ上は問題となる文言ですが、使ってみると納得でき、個人的にはある種の楽しさが表現されていると感じます。( どのような検索結果になるかはご自分で試してみてください。 )

http://www.google.com/

 いずれにしても、先の記憶実験の例にあるように、ちょっとした文言の違いでもその影響度は異なってくることを認識しておきたいものです。


18. バランス理論

 アメリカの社会心理学者ハイダーは、自分を含む3者間における 「好き」 「嫌い」 の関係を三角形の点と線で表現し、 「その積( かけ算 )がプラスの場合、その関係は自分にとって安定したものになるが、逆にマイナスになると不安定になる」 という考えを提唱しました。これは 「認知的バランス( cognitive balance )」 と呼ばれ、 「不安定な状態の時には安定する方向に好悪関係をシフトしようとする傾向がある」 と考えました。

【 例1】
「自分はチョコレートが大好きです。
しかし、チョコレートを食べるときまって虫歯になってしまいます。
当然、虫歯になって歯医者には行きたくありません。」

 この状態は、 「チョコレートが好きだけれども虫歯にはなりたくない」 という、心理的には不安定な状態です。ハイダーは 「3者間の関係を示しているプラスマイナスの符号の積により全体のバランス状態が示される」 としました。この例ですと、マイナスがひとつですから全体としては 「マイナス」 の状態となり( プラス×プラス×マイナス=マイナス )、認知的バランスという点からは不安定な状態となります。

 われわれは、認知的に不安定な状態に置かれた場合、それを回避し安定した状態にシフトさせようとします。バランスがとれた安定した状態にする( 3つの積をプラスにする )ために考えられる選択肢は、次の3つです。

( 1 )チョコレートを嫌いになる( なるべく食べないようにする )。
:自分とチョコの関係をマイナスにする。
( 2 )虫歯なんて気にしない。
:自分と虫歯の関係をプラスにする。
( 3 )虫歯にならないチョコレートが開発される。
:チョコレートと虫歯の関係がマイナスになる。

 もっとも現実的かつ建設的なのが( 1 )の選択でしょう。( 2 )は、バランスの状態としてはひとつの安定ですが、必ずしもこの選択で本質的な安定状態になるとはいえないでしょう。( 3 )は他力本願で自分ではどうすることもできない解決法です。

 以上が 「バランス理論」 の骨子です。この考え方を次のような 「ことわざや言い回し」 に当てはめてみると、さらに納得が行くかもしれません。いずれも安定した状態です。

坊主憎けりゃ袈裟まで憎い。 友だちの友だちは友だち。 敵の敵は味方。

 さて、【 例2 】のような状況はどうでしょうか。情報機器の進歩に伴ってよく聞かれる 「不安定な状態」 であり、PCに限らず携帯電話などにも当てはまる現象と思われます。

【例2】
「デザインもすっきりとしていて簡単に使えそうなPCを買いました。しかし、いざ使ってみると操作が複雑で思うように使いこなせません。毎回分厚いマニュアルを引っ張り出して操作方法を確認しなければならず、ため息が出てしまいます。」

 ここでの 「PC」 と 「分厚いマニュアル」 は本来一体化しているものですから、一度購入してしまった後にこの関係を修正することは難しいといえます。したがって、安定状態のために採られる解決法としては次の2つが主となるでしょう。

( 1 )PCへの関係をマイナスにする。
 具体的には、 「もう使わない、違うものに買い換える」 などのネガティブ感情へのシフトになります。

( 2 )マニュアルへの関係をプラスにする。
 なかなか難しいですが、 「マニュアルもよく読めば分かるなー。」 という実感を抱かせることができれば、積極的なプラス方向へのシフトとなるでしょう。逆に、 「しょうがないからマニュアルを見ながらでも我慢して使う」 ということになれば、消極的なプラス方向へのシフトになります。あるいは学習という一定期間のプロセスを経ることによるシフトも考えられます。

 ここでは不安定の原因として 「分厚いマニュアル」 を挙げましたが、それ以外にもいろいろと要因はあるでしょう。理想的な解決法としては、 「人間中心設計( HCD:human centered design )」 の視点に立ち、それらをなくしていくことによって、はじめからこのような 「不安定状態」 を作り出さないことです( 参考 「資料編:ISO13407」 )。  しかし、一朝一夕にそれが実現されることは難しいでしょうから、せめて( 2 )の解決方法の中の積極的なプラス方向へのシフトを促す工夫が必要です。あっさりと( 1 )の解決方法が選択されて、それでユーザが 「安定状態」 になってしまうような状況は避けなければなりません。


19. 意味の階層構造

 ウェブサイトのメニューや情報の構成を設計する際に、階層構造という言葉が良く使われます。上位の概念から下位の概念へと系統立てて情報を整理し階層性を明確にすることで、無駄な思考を要求しない 「使いやすさ」 を提供できます。

 この階層性が有効であることの認知心理学的な背景には、人の知識構造に関する知見があります。例えば、次の文章が意味的に正しいかどうかを、順に頭の中で考えてみてください。

A: 「カナリアは歌う。」
B: 「カナリアは飛べる。」
C: 「カナリアは皮膚がある。」

 すべて意味的には正しい文章ですが、AからCに行くほど正しいかどうかにかかる判断の時間が増すことが分かっています。これは、 「カナリア」 という言葉と 「歌う」 「飛べる」 「皮膚がある」 という言葉の意味( 概念 )の関係が、われわれの知識の中で図1のような階層性を持っていると仮定することで説明がされます。

図1.意味の階層構造の例

  「カナリア」 に直接に結びついている属性 「歌う」 は速く判断されますが、概念的にその上位の 「トリ」 の階層に属している 「飛べる」 や、さらにその上の 「動物」 の属性にある 「皮膚がある」 の場合、 「カナリア」 を基点としてネットワークを上位に戻らなければならないために、それだけ判断に時間がかかると考えられています。これは 「意味ネットワーク」 と呼ばれ、長期記憶のひとつである意味記憶に関するモデルとして知られています。

 ウェブサイトの情報も、概念の水準やそこでの属性などを整理し階層化することにより、その位置付けや他の情報との関連などが明解になります。きちんとした情報の構造化が大事であるという主張は、いろいろなところで聞かれ、ユーザであるわれわれも直感的感覚的に理解できますが、このような理論的背景からも支持することができます。


20. プライミング効果

 前回は、情報の階層構造についての心理学的な背景を紹介しました。情報に階層性を持たせることにより、検索やナビゲーションの混乱を避け、効率よく目的の情報にたどりつけます。また、これらを提示する際に、意味的関連の中での上位概念を先に見せることは、記憶のプライミング効果という点からも妥当なものと考えられます。

 プライミング効果( priming effect )とは、先行刺激( プライム )の処理が後続刺激( ターゲット )の処理に影響を及ぼす現象のことで、一種の無意識的な期待効果と考えることができます。

 例えば、次のような実験で確認されています。まず、先行刺激として単語、例えば 「パン」 が提示されます。その直後に、後続刺激として 「イス」 が提示され、被験者はこの後続の単語が意味のある単語であるかそうでないか( 例えば、キニ、ヘスなど意味を持たない単語を指す:無意味つづり )をできるかぎりすばやく答えます。このとき、先行刺激が 「テーブル」 のように後続刺激 「イス」 と意味的に関連のある語の場合、 「イス」 が単語であると判断する時間( 反応時間 )は、関連のない 「パン」 よりも短くなります。つまり、 「イス」 が単語であると判断するのに要する時間は、先に 「パン」 が提示されているときよりも 「テーブル」 が先に提示されているときの方が速くなるという現象です( 図1 )。

図1.プライミング実験の概要
 被験者が判断すべき課題は、後続のターゲット刺激が単語であるかそうでないかという単純なものです。同じ単語であるにもかかわらず、先行刺激と意味的に関連があるかないかで処理時間に差が見られるというのは面白い現象です【 注 】

 このようなプライミング効果は、実験室状況でのmsec単位での反応時間を指標としており、日常的な事態との直接対応はとりにくいかもしれません。しかし、意味の階層構造とともに、より効率的な情報提供のためのヒントとなると思われます。

【 注 】
 これらは意味的プライミングと呼ばれ、われわれの意味記憶がネットワーク構造をなしているというモデルの背景であり、次のような図式で説明されます。
(1)プライム処理( 先行刺激の処理 )に伴いその概念に対応するノードが活性化し、それがネットワーク上で拡散する。
(2)その活性化の拡散によって、意味的に関連のある概念ノードの活性化のレベルも上昇する。
(3)したがって、意味的に関連のあるターゲット( 後続刺激 )の場合には、その認知のために必要とされるノードの活性化のための処理が軽減され、認知が促進される。