Tetsu=TaLowの雑記(はてブロ版)

しがない大学教員が琵琶湖のほとりから呟きます

政府のオープンデータガイドラインに対してパブコメ提出してみました

ちょっとバズってしまったこのまとめ…
公務員が公開するネ申Excelが日本の生産性を落としている話 - Togetter
バズってしまったのでその責任取らなきゃなぁ(笑)と思って、霞ヶ関界隈でコソコソ活動していたのですが、なかなか出口が見えないでいたところ、内閣官房のIT戦略本部からこんなものが飛び出してきました。
「電子行政オープンデータ推進のためのロードマップ(案)」及び「二次利用の促進のための府省のデータ公開に関する基本的考え方(ガイドライン)(案)」に関する パブリックコメントの募集について
これは…なかなか頑張ってるけど率直な感想として…意欲は買えるけど、正直求めてるものがちょっと一足飛び過ぎるんじゃないかと思いました。オープンデータ戦略としてはまずは公開のインセンティブを高めることが重要です。公開データの再利用性も大切ですが、「機械可読形式」という言葉を繰り返したところで担当官に正確に理解できる気がしません。おそらく作業を直接担当することになるであろう係長級から平官の人たちの一般的ITリテラシでは、このガイドラインのココロを理解できないまま見よう見まねでやってしまい、かえって混乱を増すんじゃないかとちょっと心配になりました。
なので、ちょっとエイヤとパブコメ意見を提出しておきました。ここに同じものを貼り付けておきます。

ここに来てオープンデータについて推進しておられること、大変心強く思います。
一方で本ロードマップ、ガイドラインについていくつか気になる点がありますのでコメント差し上げます。

ロードマップについて

2-(1)-丸2 具体的な取組 について
『二次利用可能なデータ公開を促進するため、公開データの二次利用により生じた損害に関する免責についても明確にすることとする。』この言葉で免責される主体が明確ではありません。文脈から免責されるのはデータ公開主体、つまり省庁側・国側であると思われます(ガイドライン側にはそれが明記されています)が、これをロードマップでも明確に書いて頂けないでしょうか。省庁側担当者側のオープンデータへの障害の一つは、やはりデータ公開によって生じた損害が国の責任に問われることにより本人の責任につながる、という構造のように思います。その免責を強く打ち出すべきかと思います。

2-(2)機械判読に適したデータ形式での公開の拡大 について
この項目を受けてガイドラインにおいて「機械判読に適したデータ形式」での公開という言葉が強く出すぎている印象を受けました。これが目立ちすぎますと、機械判読に適したデータ形式になってない・変換に手間がかかることを理由にデータ公開が進まないという逆の副作用が懸念されますし、高いエンドユーザコンピューティング能力を担当者に求めると、結局データ公開の作業をアウトソースするなどの原因となりコストが増します。大事なことは2次利用の拡大であり、機械判読に適したデータ形式での公開の拡大は2次利用の拡大のための手段に過ぎないと考えます。例えばこの項目を2-(1)の項目の下に置くか、順番をさらに後方にもっていくなど、優先順位を下げた印象を与える表現にして頂いた方がよいのではないかと思います。

2-(4)公開データの拡大 について
公開データの拡大には各省庁担当者の努力が求められるところですが、業務評価に繋がらなければその努力に見合うインセンティブを与えられないと考えます。データ公開が結果として二次被害的なことにつながり非難され責任に問われることが上記2-(1)の免責によって除外されても、やはり十分な担当者のインセンティブとはなっていないと考えられます。「担当者の業務評価に結びつけることにより、データ公開のインセンティブとする」ことを明記してはどうでしょうか。また、データ公開やその機械可読形式への変換に必要な担当者のICTリテラシ向上策も書き込むことはできないでしょうか。

ガイドラインについて

ガイドラインの書き方として、二次利用という言葉よりも機械判別可能形式という言葉が強く出過ぎているように思われます。機械判別可能形式がどのような形式であるかということが判断できるほどのICTリテラシが省庁担当者に十分あればよいのですが現状はそのレベルにはなく(そもそもそのレベルにあれば現在のような状況は生まれていません)、このガイドラインを正確に読み取ることが出来る担当者がどの程度いるのか不安があります。
そこで提案ですが、本ガイドラインは、以下のことを強く打ち出した書き方に出来ないでしょうか。
1.重要なことは二次利用であることを強く書く。そのことを強く印象づけるため、ケーススタディの前に「二次利用例」を入れる。
2.「機械判別形式にすることを強制」するガイドラインから、「データ形式と表現形式は別物であり、本来は基礎データがあってそれを自己再利用することで見やすい形式に変換するものである」という印象を強く与えるケーススタディにする。現在は1つのExcel表をひたすら機械判別に向いた形式に変換する結果、単に「見栄えを悪くする」方向に変換するように読めてしまうため印象が悪い。これを、別のシートを作ってそこに機械判別に適した表(生データシート)を作った上で、そのデータからの参照やExcelの機能等を用いて元と同じ「見栄えのする」表(印刷用シート)を作り出すようなケーススタディにする。これにより、担当者自らがデータの二次利用を行うことになり、そのベネフィットを感じられるようになるはずである。

以上、意見提出します。