Clickにコミュニティ機能が追加されました。

誰でも利用可能なオープンデータカタログと活用事例まとめ

オープンデータ

2013年、主要8か国首脳会議(G8)がOpen Data Charter and Technical Annex(オープンデータ憲章及び技術付属書)を発表し「税金を使って作られたデータは全て公共財として公開すべきである」という国際的な合意形成がされたことで、世界各国の政府が保有する膨大な公共データを広く社会に公開して、民間での2次利用に役立てるという「オープンデータ活用」の機運が高まっています。

日本政府もオープンソースデータに関する各種政策を推進しており、2020年7月17日に閣議決定された「世界最先端デジタル国家創造宣言・官民データ活用推進基本計画」では「オープンデータ基本指針」が示され、同政策に基づき、全国の公共データがデータカタログサイト「DATA.GO.JP」にて公開されることとなりました。

政府や各自治体でオープンデータ活用に関する取り組みが進むにつれて、それらを2次利用したPWA(Progressive Web Application)やネイティブアプリケーションの事例も増えてきており、専門知識がなくてもオープンデータを取得・活用が出来る各種ノーコードツールの登場したことで、データ活用は多くの人々にとって、ますます身近なものとなっています。

本記事では、誰でも利用可能なオープンデータセットとその活用事例について紹介します。

誰でも利用可能なオープンデータカタログ

国内政府公的機関のデータカタログ

DATA.GO.JP

冒頭で紹介したように、DATA.GO.JPでは、各省庁・地方自治体などの27,526件を超える公共データが集められています。2020年3月の時点で人口カバー率では約76%に到達しており、国内最大規模のデータカタログとなっています。

データソースやフォーマット、アクセスランキング別で検索できる機能の他、APIの有無も表記されており、使い勝手が良いサイトです。なお、アクセスランキングの上位5つは、業者コード(事業者番号)、全国地方公共団体コード(総務省所管)、Cバンドレーダ雨量・水位、都道府県別市区町村符号及び保健所符号、所有者コード(自動車登録関係)となっています。

東京都オープンデータカタログサイト

東京都オープンデータカタログサイトには、防災、医療、福祉や産業雇用など幅広い分野のデータセットが集められています。

港区オープンデータ

市区町村単位でもオープンデータの公開は進んでおり、中でも港区は、「港区オープンデータアプリコンテスト」や「オープンデータアイデアソンキャラバン」を開催しており、オープンデータに関する取り組みが特に活発です。

e-Stat

e-Statは、日本の統計が閲覧できる政府統計ポータルサイトです。機械判読可能な形式で取得できるAPI機能も提供しており、小地域・地域メッシュデータが取得できます。データセットの階層構造が不適切な場合もありますが、機械判読性の高いcsv形式のデータが多く有用なサイトと言えます。

RESAS

産業構造や人口動態、人の流れなどの官民ビッグデータを集約し、可視化するシステムです。地方創生の様々な取り組みを情報面から支援するために、経済産業省と内閣官房が提供しています。

海外のデータカタログ

Data.gov

Data.govは、米国政府機関が保有する情報・データを入手できるサイトです。ローデータを様々な形(CSV、JSON、PDF、RDF、RSSなど)で取得可能であり、自由に二次利用できます。また、「Open Data API」を利用することによって各データをAPI経由での取得も可能です。

The  World Factbook  

 CIAが毎年公開しているThe World Factbookのサイトでは、人口統計・地理・通信・政治・経済・軍事など広範な分野のデータを無料で閲覧できます。HTMLファイルでダウンロードできるデータもあります。

The World Bank Open Data

世界銀行のサイトでもオープンデータカタログが充実しています。

Google Cloud 一般公開データセット

Google Cloudでは、BigQuery、Cloud Storage、Earth Engine などの Google Cloud サービスが提供するビルド済みのデータ ソリューションやデータセットを活用することが出来ます。Google Cloud Marketplace にある 200 以上の公開データセットを利用することも可能であり、「Storm Events Databaseの提供する気象データを取り込み、住宅リフォーム小売業者が台風により在庫が受ける影響を把握に役立てる」「Census Bureau US Boundariesの地理データを活用して、小売業のための都市化インデックスを作成する」といったユースケースが紹介されています。かねてよりデータエコシステムの拡大に取り組んできたGoogleは、データ活用の分野においても既にグローバルスタンダードを確立しているため、活用方法についても多くのことが学べます。

Youtube8M

静止画に比べて遅れていた動画データの分析を加速させるため、Googleは800万本ものYouTube動画のデータセットを公開しています。

Open Data on AWS

AWSはサイエンス分野のオープンデータに注力していることで知られており、発がん因子のゲノムデータがまとめられたThe Cancer Genome AtlasやNASAとの共同プロジェクトにより作られたNASA Space Act Agreementなどのデータセットがあります。

オープンデータ活用のポイント

次にオープンデータ活用のポイントを紹介します。様々な活用方法がありますが、大きく以下の4つの方法に分別できます。

情報の統合

バラバラに公開されていたデータを収集・統合することで新たな価値を生み出すという切り口は、オープンデータの活用を考える上で非常に重要です。近年、iPaaS(Integrated Platform as a Service)やHorizontal SaaSの発展は目覚ましく、専門知識がなくてもデータ収集・統合が出来るノーコードツールが増えているため、これらを活用することでオープンデータの収集・統合はより加速します。

(例:各市町村の広報誌をダッシュボードで一覧化)

視認性の向上

公共データカタログは網羅性や有益性は高いものの、数字を羅列したままで視認性が低い場合も多くあります。インフォグラフィックなどを用いて有益な情報をより見やすく可視化することは、多くの人々の支持を集めることが期待できます。

(例:各自治体の予算案をインフォグラフィックで可視化)

コンテンツとして利用

官民を問わず、自社サービスのコンテンツとして公共データを活用する動きが広がっています。エビデンスレベルの高い公共データを活用することでコンテンツの幅が広がります。

(例:各自治体の発表する天気予報のデータを収集し、地域ごとに高精度の天気予報アプリを提供する)

システマティックレビュー/メタアナリシス

複数のデータを収集・分析することで、より高度な分析に利用して、よりエビデンスレベルの高い法則を導き出す「システマティックレビュー/メタアナリシス」を作成する際にもオープンデータの活用は有用です。

(例:新型コロナウィルスの罹患状況を収集し、特定の法則を導き出す)

オープンデータの活用事例

それでは具体的なオープンデータの活用事例を見ていきましょう。

統計Dashboard

国や民間企業等が提供している主要な統計データをグラフで提供しているサイトです。収録されている約5,000のデータセットは、分野ごとに整理されている他、データを経時的に閲覧することもできます。統計データを活用して視覚化するという試みは、今後も増えていくことでしょう。

「マイ広報誌」

「地域の情報をもっと身近にもっと便利に」をコンセプトとして作られた「マイ広報誌」では、市区長村の広報紙を気軽にチェックすることが出来ます。現在、マイページの機能は停止しているものの、各市区町村の広報を一覧で見れる機能は利便性が高く、中にはお得な商品券の情報などが掲載されているものもあります。

「統計でみる山口県のすがた」

総務省が公開しているオープンデータを活用し、全国比較の可能な指標について山口県分がまとめられています。人口、教育、福祉、経済基盤、産業など広い分野における主要統計指標の中から、市町別に比較の可能な50の指標が過去4年分に渡って経時的にまとめられています。

COVID-19×災害時避難に関する情報集約サイト(β版)

各自治体から発信されているCOVID-19下における災害時避難に関する情報を集約し、地図上で可視化したWebサイトです。

新型コロナダッシュボード

新型コロナダッシュボードは、各自治体が公開している新型コロナウィルスに関するデータセットをもとに作られており、現在患者数/対策病床数、対策病床数 、PCR検査陽性者数といった指標を一覧できるサイトです。昨年3月にリリースされた同サイトのドレインレートは67(エイチレフス調べ)であり、個人により作成されたサイトでありながら広く支持を受けていることが分かります。

カーリル

カーリルは、全国7,300以上の図書館からリアルタイムの貸出状況を検索できるサービスです。公共図書館の他にも大学図書館や専門図書館もカバーしており、お気に入りの本を紹介するSNS機能もあります。これまで点在していた全国の図書館の情報をリアルタイムで可視化したという点において、オープンソースデータの活用のインパクトを感じさせるサービスであると言えるでしょう。

LAG Ltd

オセアニア地区で最大の保険会社であるInsurance Australia Group Limitedが運営する地区ごとの自然災害に対する脆弱性を可視化したサイトです。統計局や気象庁、地方自治体のデータを利用して作られています。

Budget Stories

モルドバ政府公的機関の各予算案をインフォグラフィックなどを用いて視覚化されています。「透明性のある政府」という概念は、オープンソースデータの活用の中でも注目を集めています。