シンポジウム「デジタル写真データベースが拓く学術活動の未来―蓄積された画像資料をいかに活用するのか―」メモ



カレントアウェアネス・ポータルを見ていたら興味深いイベントの告知が掲載されていました。国立民族学博物館のイベントということでてっきり大阪か今日とかと思っていたら東京の開催なのですね。関西にいたときだったら悔しがってたと思いますが、今回はこれ幸いとばかりにお邪魔してきました。


以下、大体の概要と自分の感想メモです。専門外の分野ですので勘違い・誤認などありましたらご容赦ください。

開会のご挨拶 

感想

  • 研究者間での共有だけでなく、撮影対象となった方々(個人でなくコミュニティレベル)との共有という視点が民博っぽいと思った。
  • オープンサイエンスというと研究者間、ないし第3者がデータを利用するイメージだったので、研究対象者に対してのオープンという視点は新鮮だった。


「写真が築くグローバル・ネットワーク――DiPLASがめざすもの」

  • 発表者:飯田卓先生(国立民族学博物館/DiPLAS研究支援分担者)
  • 発表は2段階。①事業の説明を理解するための枕として事業の基盤となっている枠組みや学術写真資料の整理の状況についての話、次いで②表題のとおりDiPLASの説明。
  • 研費の「新学術領域研究(研究領域提案型)」は研究活動のための経費を助成するものではなく、研究支援にかかる経費を助成すること。
  • DiPLASにあてはめると目的は民博の研究活動を支援することではなく、民博の外にいる研究者を支援するということになる。具体的には、写真整理の事業を進めたい研究者がDiPLASに申請して支援を受けるかたちになる。 
  • この事業の背景として、①個人が所有する写真の「幾何級数的な増大」に加え②現役の研究者と退職世代(と彼らが撮影した写真の量)のアンバランスがある。写真資料はいつどこでだれが撮影したのかメタデータがないと価値が乏しいままだが、整理をする担い手が少ないという問題意識。
  • 支援を受ける動機の想定。①メタデータの付与ツールとしてのDiPLASの活用、②関係者間での写真共有、③撮影地とのコミュニケーション、④サーバ運営など公開にかかわる実務が簡便化。
  • 公募/応募状況の紹介として申請案件別の地域、時代、コマ数の概要。古いもので1970年代~新しいもので2017年。フィルムとデジタル両方があり。
  • デジタル化に伴う写真整理。各スライド・写真単位だけでなく、スライドホルダー単位でも撮影。(現物は撮影後に原状復帰して返却。)
  • デジタル化に伴う著作権処理。原則は著作権の譲渡で、覚書を交わす。例外的に複製権と公衆送信権に関してのみ許諾を得ることもあり。
  • 肖像権については完璧は難易度が高いので文化的な意味も考慮し支援対象者と相談。

感想

  • 支援を受ける動機の想定について。自分がレファ協担当の際に説明していた内容と似てる(①レファレンスデータの管理ツールとして利用、②分館や別フロアなど複数場所にまたがる情報共有、③未解決事例の情報提供に関するコミュニケーション、④国会図書館によるシステム運用保守)心強さを得ると同時に、やはりみなここに行きつかざるを得ないのかなぁと少し複雑な気持ちに…。
  • アナログ以外にも対象としてデジタル写真データ、それも初期から現在までが含まれている。デジタルでも時期や個人によって様々な媒体や形式、(メタ)データの持ち方をしており、「デジタル」と一言で済ませられないばらつきがあるのでは?
  • この日は支援対象者へのプロモーション的な意味が強そうだったので基本的に発言は控えていたが、また機会があれば担当者の方へお尋ねしてみたいかも。(のちの質疑含め、この日はこの辺の話題はあまり出ず。)

「デジタルアーカイブズの構築支援とライブラリへの展開」

  • 発表者:丸川雄三先生(国立民族学博物館/DiPLAS研究支援分担者)
  • 開発中のシステムのスクリーンショットも交えての具体的な手順の紹介。図解としてはDiPLASのウェブサイトに掲載されているものを紹介。
  • フィルムのデジタル化については前述のとおりシートと画像それぞれのレベルで撮影。写真の撮影にはKodakのフィルムスキャナやSlideSnap Proという 映写機のスライド送り部分とデジカメをくっつけたような機器を使っているとのこと。
  • メタデータについてはいくつかのグループに分けて支援対象者と分担して付与。
  • 支援対象者(撮影者)が入力するのはルールにそれほど細かくこだわらない写真の説明的な情報。
  • 民博が入力するのは撮影機材やフィルムなどの情報、提供された情報をもとにしたコレクション毎の整理のための情報、地域とコレクションをまたいで検索するための統制された情報など。
  • メタデータのテキストから、また画像認識で得た情報からの索引語自動生成も検討中。
  • その他画面の紹介など。
  • 一般公開用の「DiPLASフォトライブラリ」の紹介。利用条件や写真利用のための窓口、IIIF対応などを検討中。

感想

  • 機械、支援者、被支援者の間での作業分担の最適解を模索されている印象。
  • 不均質で多数の人が関与するプロジェクトにしては複雑に過ぎる感もしないでもないけど民博側できっちり体制ができていて問題ないということっぽい?
  • メタデータのスキーマやシステムの裏側がどうなってるのか気になる。

「アフリカの自然と人――45年間の画像記録から変化を考える」

概要メモ ※ここでは(感想:感想メモ)

  • 発表者:市川光雄先生(京都大学名誉教授/科研費代表者)
  • 若いころからフィールドワークで写真を撮り続けている。2000年代以降デジタルカメラになっている。(感想:各時代通して写真を撮り続けてらっしゃっており、DiPLASプロジェクトとしてはまさに想定ど真ん中の支援対象?)
  • フィールドワークの成果物は①フィールドノート類(最大の財産)、②動植物標本類(大学博物館/データベースは京大地域学研究所へ)、③物質文化資料(リトルワールド人間博物館へ)、④音声資料(多くはカセットのまま、一部デジタル化済。ほとんど未利用)、⑤画像・映像資料(一部はデジタル化。) ⑥写真資料 
  • ⑥写真資料について。一部デジタル化だが大半は未デジタル化 。
  • 劣化の恐れがあるが、データベースに入れてもなかなか整理が進まない。「1件で5分くらいはかかってしまい大変。思いついたことを思いついた順番、様式で入れられるとよい、フィールドがたくさんあるので大変」とのこと。(感想:→ほんまそれ。わかりみありすぎる。)
  • 写真やフィールドワークでの経験の説明など。(感想:写真の説明をされている先生はとても楽しそう。一つ一つの説明に写真がつく/写真にご本人の説明がつくので大変わかりやすい。こういう情報がメタデータに落としこめたらとても素晴らしいが…。)
  • 別の研究者の撮影した写真をもっていくと取ってくれと人が集まってくる。(感想:別の人が撮影した写真を介してのコミュニケーションというのは、何十年前のフィールドワークですでに存在していた。)
  • 着衣や住居は変化が見られやすい。(感想:短時間の変化が激しく、別の人が撮った写真も役に立つ。)
  • 時間の経過に伴うフィールドワークのやり方の変化。個人調査からチームへ。一方的な調査ではなく在来知と近代科学の対話。 
  • リビングミュージアムの紹介。 東アフリカ、南アフリカで伝統的生活をあえて演じて現金収入にする。儀礼や結婚式の実演がメニュー化され料金表もあるが、あまり売れてないとのこと。
  • エスノツーリズム。観光客へ見せるだけでなく、地元住民を交えたワークショップなどを開き在来の知識・技術の伝承もする。
  • 文化を人に見せて切り売りをするということについて、彼らがどう考えているかを考えなきゃいけない。(感想: 研究者が撮影した写真はだれのものか。撮影者と被写体の両方がないと写真は成り立たない。リビングミュージアムなどは写真を含む研究の成果物をどう扱うべきなのかを考えるヒントになりそう。研究対象が人であるという学問ならではのオープンサイエンスというのがあるのかも。)

「アラビア半島オアシス生活の半世紀――現地社会への成果還元に向け」

  • 発表者:縄田浩志先生(秋田大学/片倉もとこ記念沙漠文化財団/科研費代表者)
  • DiPLASにおける被支援者と撮影者が異なるケース。具体的には、写真を撮影されたのは片倉先生、DiPLASの代表者は縄田先生。
  • 「こういう研究は長く世代を超えてこそ意味がある」byコボリ先生(小堀巌先生?)
  • 各種現地の人のNG写真。(くつろいでいる写真、家同士の項的儀式などでだれかわかる者ものetc)。何がダメ、何がよいというのは研究者でもすぐにわかるものではない。 

感想メモ

  •  今回のこれは地域研究ということで外国の話が多いけれど、日本国内の各地域でも同じことが言えそう。
  • 社会への還元という点で公的機関(特に図書館)の限界はどこにあるのか。 同じ公的機関でも民博と一般の図書館では違いそう。
  • そういえば歴史学や文学でなく民俗学、地域研究、地理をバックグラウンドに持った公立図書館のライブラリアンってどれだけいるんだろう。
  • ある日、外国の人が自分の地域や関係者の写真を持って来てくれたらうれしいよなあ。 (人によるとは思うけれど。)

「AI時代のデジタル写真データベース」

  • 発表者:北本朝展氏(国立情報学研究所/DiPLAS研究支援協力者)
  • Androidのアプリ、メモリーグラフの紹介
  • 画像検索について。Googleの「画像検索」は画像そのもの分析ではなく、周辺のテキストから類推している。Googleの色からの画像検索は画像そのもののデータを見ている。種類からの検索については顔、線画、写真なども画像の中身を見ている。 
  • 学術写真整理ツールのTropyの紹介。AIの技術は使用されていない。 
  • 写真整理の問題点。撮影者しかわからない情報(コンテキスト)は本人入力しかないが画像注釈のトータルコストは高い。どれだけ大変か予測できないため開始するまででの障壁が高い。
  • 公開可能か不可かの仕分けはプライバシーや文化の問題も関係する。 
  • データ整備のコストが障害となって写真がうもれる。コストをどれだけ下げるかが問題である。
  • 機械学習とは? 機会あり学習、教師なし学習、強化学習 、アルゴリズムなど。
  • 最近の大ブーム:ディープラーニング(深層学習)。いわゆる「AI」は深層学習を指す。
  • 人工知能と機械学習は重なる部分が多いが同じものではない  2011年くらいに深層学習のおかげで画像分類のエラー率ががくっと下がったことがブームのきっかけか。今は人間よりもエラー率が低い。
  • 今はフリッカーのタグ付けなどふつうにつかわれている技術。
  • 画像とテキストを同時に学習する深層学習もある。(自動キャプション生成) 
  • ニューラルネットワーク 。多数のパラメータを自動調整する。すでに学習したデータと似たデータが入力されれば正解が多いがデータの意味は理解していない。
  • ブラックボックス問題(なんでそうなったかは不明) 
  • Open images dataset 。学習済みモデルが配布されており、だれでも試すことができる。 
  • ガーナの文化遺産に関する調査の成果を利用して実験した。写真3700枚を使ってperson, foodなど。beerなど人間がおよそタグ付けしなさそうなものもある。
  • 結果としては利用した機械学習のデータセットと相性が良いようだ。(もとになったデータが似てる?)
  • 第一段階の整理方法としては期待以上に使えそう。
  • ただし、データセットはGoogle由来なのでGoogleのサービスでこそ最良の質が得られる。つまり、Googleにない機能が問われているという意味では…。
  • DiPLASの目指す方向は地域研究の立場から考える必要がある。 
  • 画像から何を読み取れるか。Person等のタグ付けじゃなくて、人のポーズ、動きや身なり(文化的要素)から何を読み取れるか。
  •  Semantic Gap。物理的世界と意味的政界のギャップ。取り組みやすい(物理の世界。専門家の代替)/取り組みにくい(意味の世界。専門家の支援) 
  • 人機分業のデザイン。専門家にしかできないことは何か機会が得意なことは何か。人間にできないことや人間には苦痛なことを機会がやるのが付加価値。
  • 情報触媒とモチベーション。仕事を開始するのに必要なエネルギーを下げるというアイデア。機械の仕事で人間がやる気を出す仕組み。
  • 今後の研究の方向性。機械による自動タグ付けでは「価値が高い」タグ付けをどのように選べばよいか。
  • 人間によるタグの追加 、画像注釈支援、作成者と利用者との互恵関係…。
  • まとめ。写真にまつわる現状説明、ディープラーニングの紹介、ガーナの写真で実験、AIで写真注釈への障壁を下げる。 

感想

  • 先進的な技術を使ってこれまでにできなかったことをやる=実運用での価値は(ryというような「研究」とは異なり、実務の側から求められるような内容だった。
  • 自分ではやらないけど人のやった成果を見ると口や手を出したくなるのが人情。何もないところから入力させるプロジェクトより、書誌同定や翻刻などといったものの方がクラウドソーシングで実施されているのも同様の理由かも。

    あまり長くなるとアレなのでとりあえずここまで。討論はまたいずれ時間があれば。

    コメント