I`m Keiko - 共通語彙基盤整備事業

共通語彙基盤の推進
政府CIO補佐官
経済産業省CIO補佐官
平本 健二
0
お名前は
田中です
恵子です
戸籍では
田中蕙子です
田中恵子です
旧姓は
鈴木です
たなかです
I'm Keiko
通称は
鈴木けい子
です
たなかけいこ
です
1
なぜ語彙なのか?
2
語彙基盤の意義
①違う表現の単語を同じ単語とみなす
ジャガイモ
馬鈴薯
メイクイーン
ポテト
商品
ジャガイモ
値段
50円
人であれば同じと判断できるが、コンピュータでは判断できない
同じ意味だと管理する
管理方法1:同じ単語であると、表などで管理する
管理方法2:コンピュータで、同じ意味と自動処理する
②同じ表現であるが意味が違うモノを明確にする
違う部門では、同じ言葉でも、完全に同じ意味とは限らない
避難所
病院
消防
水
水
水
(例:同じ「水」であっても業界で意味が異なる)
避難所
病院
消防
飲料水
蒸留水
消火用水
違う意味だと管理する
複数のサービスやシステムを連携するときには、核となる技術である。
3
様々な語彙①
 政府内で共通的にルールを作るほうが望ましい語彙
 住所、氏名、組織など、業務特性に依存しないもの
入力したいデータ
100-0013 東京都千代田区霞が関3-3-1尚友会館2階
株式会社田中商店
代表取締役 田中一郎
各種申請の入力様式
申請Aの記述様式
100-0013 千代田区
株式会社 田中商店
田中 一郎 タナカ
霞が関三丁目3-1 尚友会館2階
カブシキカイシャ タナカショウテン
イチロウ
申請Bの記述様式
100-0013 千代田区 霞が関三丁目3-1尚友会館2階
行政の申請においても、
チヨダクカスミガセキ
株式会社田中商店 タナカショウテン
基本的な語彙(住所、氏名等)
代表取締役 田中 一郎 タナカ イチロウ
の記載方法が異なる
申請Cの記述様式
100-0013 東京都 千代田区 霞が関
株式会社田中商店
田中 一郎 タナカ イチロウ
3 3
1
尚友会館2階
4
様々な語彙②
 現場の状況を整理しボトムアップで作り上げていく語彙
 利用ニーズが高く、具体的な整理が各地で施行される領域
 情報連携用語彙データベースプロジェクトやツールプロジェクトの中でユースケース
をもとに整備していく。
避難所
避難所
指定避難所
福祉避難所
仮の定義
避難所の総称
自治体があらかじめ指定した避難所
生活に解除などが必要な方が入る避難所
災害時に避難所に特別に解放されてできる
仮設避難所
仮の避難所
広域で避難者支援を行うための活動拠点。臨
広域応援活動拠点
時ヘリポートや備蓄倉庫等を保有。
避難場所の総称
避難場所
避難場所へ避難する前に、近隣の避難者が
一時的に集合して様子を見る場所又は避難
緊急避難場所
者が避難のために一時的に集団を形成する
場所
大地震時に発生する延焼火災やその他の危
険から避難者の生命を保護するために必要
広域避難場所
な面積を有する大規模公園、緑地等のオープ
ンスペースをいう。
帰宅困難者受入施設
帰宅困難者が一時的に滞在する施設
帰宅者に対してトイレの提供等の各種支援を
災害時帰宅支援ステーション
する民間施設
都道府県の施設などで、市町村が一時的に
一時避難施設
利用する避難施設
自治体A
自治体A-1
自治体B
避難所
二次避難所
避難所
避難所
自治体B-1
避難施設
一時集合場所
広域応援活動拠点
地域防災拠点
広域避難地
広域避難場所
一時避難場所
広域避難場所
一時滞在施設、一時待機施設
災害時帰宅支援ステーション
帰宅困難者一時滞在施設
災害時帰宅支援ステーション 災害時帰宅支援ステーション
一時避難施設、一時避難
所、一時受入施設
都道府県と市町村の語彙が違っており、情報をマッシュアップできない
5
様々な語彙③
 既存語彙や外部語彙との連携する語彙
 府省、業界などで、国内、国際に通用している既存の語彙とは参照関係で連携する。
既に普及、または今後は普及が見込まれる、ドメイン専門部門等が整備した語彙
→積極的に活用。または、連携マップを整備。
公共施設情報 (○○博物館)
施設:博物館
名称
場所
○既存語彙をそのまま活用
○○博物館
住所
経緯度座標
地理空間
・施設
移動
・交通
コア
語彙
防災
ドメイン
共通語彙
ドメイン
固有語彙
財務
既存語彙(地図)
・・・
博物館
・・・
病院
・・・
ドメイン語彙は、
既存の語彙に準拠等
地理識別子
連絡先
都道府県
東京都
市区町村
江東区
...
...
緯度
35.xxxxxxxx
経度
139.xxxxxxxx
識別子体系
□□住所コード
識別子
13103xxxxxx
電話番号
03-xxxx-xxxx
...
スケジュール
内容
開館時間
開始時間
09:00:00+09:00
終了時間
17:00:00+09:00
曜日
アクセス
防災:
避難所
最寄り駅
MON,TUE,THU,FRI
交通:駅
名称
△△駅
...
...
受入可能人数
800
救護所
True
ヘリ離着陸
False
IMIの構造を使って、詳細情報を付加できる
(この部分も既存の構造があれば活用)
○複数語彙が並列している場合などは連携マップを整備
防災分野で使っている「啓開」
は、「開通」のことですね
観光業界さん。IMIで定義する
「啓開」の情報を送ります
防災語彙
避難路
通行規制
啓開
避難所
・・・
IMI
避難路
通行規制
開通
意味を明確化して連携
観光業界語彙
・・・
通行止
開通
・・・
6
共通語彙基盤(IMI: Infrastructure for Multi-layer Interoperability)の整備
 情報を正しく効率的に交換、活用していくためには、人名、住所、物等、
データを体系的、かつ、構造的に定義して行く必要がある。
システム連携
共通語彙基盤は、用語の参照辞書を整備するこ
とで、各種データの同一性の確認を容易にし、そ
の結果として、システム間の連携やオープンデー
タの活用を容易にできるようにする仕組み。
語彙(ボキャブラリ)、
情報交換パッケージ(IEP)
項目名(Type/Sub-properties)
人型
氏名
性別
項目名(エントリー名)
ic:人型
ic:人_氏名
ic:人_性別
Substitutable Elements:
性別コード
性別名
生年月日
死亡年月日
現住所
本籍
国籍
ic:人_国籍
+ PersonSexCode
+ PersonSexText
BirthDate
DeathDate
PresentAddress
LegalResidence
データタイプ(英語)
cardinality
ic:PersonNameType
<abstract element, no type>
0..1
0..1
項目説明
人の情報を表現するためのデータ型。
氏名
性別
codes:性別コード型
ic:テキスト型
ic:日付型
ic:日付型
ic:住所型
ic:住所型
codes:GenderCodeType
ic:TextType
ic:DateType
ic:DateType
ic:AddressType
ic:AddressType
0..1
0..1
0..1
0..1
性別コード
性別の名称。
生年月日
死亡年月日
現住所
本籍
項目説明(英語)
サンプル値
Name of a Person
Gender of a Person
1
Gender of a Person
Gender of a Person
Date of Birth of a Person
Date of Death of a Person
1
男
-
nc:PersonSexCode
nc:PersonSexText
nc:PersonBirthDate
dateOfBirth
nc:PersonDeathDate
dateOfDeath
nc:PersonResidenceAssociresidency
Citizenship
<抽象要素>
<abstract element, no type>
0..n
-
nc:PersonCitizenship
A county that assigns rights, duties, and privileges to a person because of
the birth or naturalization of the person in that country.
Mappin g to NIEM
nc:PersonType
nc:PersonName
nc:PersonSex
オープンデータ
Mappin g to ISA Joinup
Person
gender
国籍
語彙で意味を確認し、情報
交換パッケージから、情報
を抽出
・サービス設計の効率化
・安定した情報連携
citizenship
Substitutable Elements:
国籍名
ic:人_国籍名
国籍コード
ic:人_国籍コード
ISO3166Alpha2
ic:人_ISO3166Alpha2
ISO3166Alpha3
ic:人_ISO3166Alpha3
ISO3166Numeric
データタイプ
ic:氏名型
<抽象要素>
Substitutable Elements:
ic:人_性別コード
ic:人_性別名
ic:人_生年月日
ic:人_死亡年月日
ic:人_現住所
ic:人_本籍
Substitutable Elements:
出生国
出生地
氏名型
姓名
カナ姓名
ローマ字姓名
姓
カナ姓
ローマ字姓
名
カナ名
ローマ字名
ミドルネーム
カナミドルネーム
ローマ字ミドルネーム
旧姓
カナ旧姓
ローマ字旧姓
英語名
PersonType
PersonName
PersonSex
情報交換パッケージに
より、システム間を連携
・高速な情報連携
・設計の効率化
+ CitizenshipText
+ CitizenshipCode
ic:人_ISO3166Numeric
ic:人_出生国
ic:人_出生地
ic:氏名型
ic:氏名_姓名
ic:氏名_カナ姓名
ic:氏名_ローマ字姓名
ic:氏名_姓
ic:氏名_カナ姓
ic:氏名_ローマ字姓
ic:氏名_名
ic:氏名_カナ名
ic:氏名_ローマ字名
ic:氏名_ミドルネーム
ic:氏名_カナミドルネーム
ic:氏名_ローマ字ミドルネーム
ic:氏名_旧姓
ic:氏名_カナ旧姓
ic:氏名_ローマ字旧姓
ic:テキスト型
codes:国籍コード型
ic:TextType
国籍の名称。
codes:CitizenshipCodeType
住民基本台帳で利用されている国籍コード。
+ ISO3166Alpha2
iso_3166:ISO3166Alpha2CodeTiso_3166:ISO3166Alpha2CodeType
国名コード。ISO3166Alpha2。2文字コード。
+ ISO3166Alpha3
iso_3166:ISO3166Alpha3CodeTiso_3166:ISO3166Alpha3CodeType
国名コード。ISO3166Alpha3。3文字コード。
+ ISO3166Numeric
iso_3166:ISO3166NumericCodeiso_3166:ISO3166NumericCodeType
国名コード。ISO3166Numeric。数字3桁コード。
ic:場所型
ic:場所型
ic:LocationType
ic:LocationType
0..1
0..1
ic:テキスト型
ic:カタカナテキスト型
ic:テキスト型
ic:テキスト型
ic:カタカナテキスト型
ic:テキスト型
ic:テキスト型
ic:カタカナテキスト型
ic:テキスト型
ic:テキスト型
ic:カタカナテキスト型
ic:テキスト型
ic:テキスト型
ic:カタカナテキスト型
ic:テキスト型
ic:TextType
ic:TextType
ic:TextType
ic:TextType
ic:TextType
ic:TextType
ic:TextType
ic:TextType
ic:TextType
ic:TextType
ic:TextType
ic:TextType
ic:TextType
ic:TextType
ic:TextType
0..1
0..1
0..1
0..1
0..1
0..1
0..1
0..1
0..1
0..1
0..1
0..1
0..1
0..1
0..1
生まれた国。
生まれた場所。
氏名を表現するためのデータ型。
氏名(姓、名)。
氏名(姓、名)のカナ表記。
氏名(姓、名)のローマ字表記。
姓。
姓のカナ表記。
姓のローマ表記。
名。
名のカナ表記。
名のローマ字表記。
ミドルネーム。
ミドルネームのカナ表記。
ミドルネームのローマ字表記。
旧姓。
旧姓のカナ表記。
旧姓のローマ字表記。
BirthCountry
BirthPlace
PersonNameType
FullName
KanaFullName
RomanFullName
FamilyName
KanaFamilyName
RomanFamilyName
GivenName
KanaGivenName
RomanGivenName
MiddleName
KanaMiddleName
RomanMiddleName
MaidenName
KanaMaidenName
RomanMaidenName
A county that assigns rights, duties, and privileges to a person because of
the birth or naturalization of the person in that country.
A county that assigns rights, duties, and privileges to a person because of
the birth or naturalization of the person in that country.
A county that assigns rights, duties, and privileges to a person because of
the birth or naturalization of the person in that country.
A county that assigns rights, duties, and privileges to a person because of
the birth or naturalization of the person in that country.
A county that assigns rights, duties, and privileges to a person because of
the birth or naturalization of the person in that country.
A location where a person was born.
A location where a person was born.
Full name of a Person
Full name in Katakana.
Full name in Roman alphabet.
Family name of a Person
Family name in Katakana.
Family name in Roman alphabet.
Given name of a Person
Given name in Katakana.
Given name in Roman alphabet.
Middle name of a person
Middle name in Katakana.
Middle name in Roman alphabet.
Maiden name.
Maiden name in Katakana.
Maiden name in Roman alphabet.
日本国
392
nc:PersonCitizenshipText
nc:PersonCitizenshipFIPS10-4Code
nc:PersonCitizenshipISO3166Alpha2Code
nc:PersonCitizenshipISO3166Alpha3Code
nc:PersonCitizenshipISO3166NumericCode
経済 太郎
ケイザイタロウ
Keizai Taro
経済
ケイザイ
太郎
タロウ
nc:PersonBirthLocation
nc:PersonBirthLocation
nc:PersonNameType
nc:PersonFullName
countryOfBirth
placeOfBirth
nc:PersonSurName
familyName
fullName
nc:PersonGivenName
given name
nc:PersonMiddleName
alternativeName
nc:PersonMaidenName
birthName
三鷹市立第四小学校
ic:建物_所在
ic:場所_地名
ic:場所_地理識別子
ic:場所_住所
東京都三鷹市下連雀1
丁目25−1
ic:住所_住所
ic:住所_構造化住所
ic:構造化住所_国
ic:構造化住所_都道府県
ic:構造化住所_市区町村
ic:構造化住所_町名
ic:構造化住所_街区符号
ic:構造化住所_住居番号
ic:構造化住所_地番
ic:構造化住所_方書
東京都
三鷹市
下連雀
1
25
1
ic:方書_方書
ic:方書_ビル名
ic:方書_部屋番号
ic:構造化住所_郵便番号
ic:構造化住所_住所ID
ic:構造化住所_住所コード
181-0013
ic:場所_経緯度座標
ic:経緯度座標系_測地系コード
ic:経緯度座標系_緯度
ic:緯度_度
ic:緯度_分
ic:緯度_秒
ic:経緯度座標系_経度
ic:経度_度
ic:経度_分
ic:経度_秒
ic:場所_UTM座標
ic:UTM座標系_UTM座標
ic:UTM座標系_UTM測地系ID
ic:UTM座標系_東距
ic:UTM座標系_グリッドゾーンID
ic:UTM座標系_グリッドゾーン格子 ID
ic:UTM座標系_北距
検索
ic:場所_MGRS座標
ic:MGRS座標系_MGRS座標
ic:MGRS座標系_MGRS座標格子ID
ic:建物_施設情報
ic:施設_ID
ic:証明_識別ID
ic:証明_証明種類
ic:証明_発行日
ic:証明_失効日
ic:証明_発行者
ic:施設_名称
ic:施設_種別
ic:施設_商用区分
ic:施設_概要
三鷹市立第四小学校
小学校
小・中一貫教育校「連
雀学園」に属する小学
校。
Schema.org
検索エンジン大手が整備する
構造化データマークアップの共通仕様
語彙間の整理をしておくこ
とで、検索を効果的に実施
・検索の利便性の向上
・効果的な広報の実施
7
共通語彙基盤の構造
 共通語彙基盤はコア語彙、共通語彙及びドメイン固有語彙から成り立つ。
コア語彙
どの分野でも利用される普遍的な語彙。
例)人、物、場所、日付 など
地理空間
・施設
病院
ドメイン共通語彙
分野固有の語彙の内、他の分野で
も参照する主要な語彙。
例)病院、駅名、避難所 など
住所
コア
語彙
ドメイン共
通語彙
ドメイン固有語彙
各分野での利用に特化した語彙。
例)病床数、時刻表 など
ドメイン
固有語彙
移動
・交通
駅
避難所
防災
災害
復旧費
財務
8
情報構造のイメージ
 施設の情報は、コアのボキャブラリとドメインのボキャブラリの組
み合わせで表す。
病院
小学校
建物
イベント
建物
所在(住所)
所在(住所)
施設情報
施設情報
建築物情報
建築物情報
コア
ボキャブラリ
診療科
状況
建物
ドメイン
ボキャブラリ
所在(住所)
避難所情報
生徒数
スケジュール
連絡先
ベッド数
9
地域情報で顕在化している課題の解決
 地域マップの情報がバラバラだと、情報交換できないだけではなく、
行政機関外のサポートも受けにくい。
都道府県の持
つ施設情報
A市の
施設情報
広域アプリや地域アプリ
が作りやすくなる
D市の
施設情報
B市の
施設情報
C市の
施設情報
従来
共通語彙対応すると
上記の各情報がバラバラで検
索できない
公開用情報が統一されるので、組み
合わせて使ったり、様々な使い方が可
能。
10
政策的な推進
11
共通語彙基盤に関する決定
 平成6年「行政情報化推進基本計画」閣議決定
 省庁間の情報の共有及び円滑な流通に必要なデータコード、データ項目等基本的事項の標準
化
 平成23年「共通語彙基盤(公共情報交換標準スキーム)プロジェクト」開始
 平成25年「世界最先端IT国家創造宣言」閣議決定
 データの組み合わせや横断的利用を容易とする共通の語彙の基盤構築にも取り組む。
 国民がステークホルダーとして積極的に参加できるよう、クラウドを活用したオープンな利用環
境を、データ・フォーマット、用語、コード、文字等の標準化・共通化、APIの公開等を行いつつ整
備する。
 平成25年「情報連携用語彙データベース、ツールプロジェクト」開始
 平成26年「電子行政分野におけるオープンな利用環境整備に
向けたアクションプラン」CIO連絡会議決定
2.1 オープンな利用環境の実現 (2)用語の共通化等について
• システム間の連携やデータの二次利用を円滑にするためには、氏名、住所、組織等の普
遍的用語の記述に関する情報連携用語彙の早期整備を図るとともに、各組織が運用する
既存の語彙との連携方法を整理することが必要である。
• 経済産業省において、国際的な連携を踏まえた情報連携用語彙の整備を進め、整備され
た語彙から順次公開するとともに、平成27年度中に情報連携用語彙DBの運用を開始する。
• 総務省において、情報流通連携基盤共通API等の開発・実証を平成 27年度中に行う。 12
オープンな利用環境整備のためのアクションプラン
 政府の情報提供基盤の抜本的な改革。
表面的な改革でなく、基盤から整理し、2020年に機動的にサービスを創出する環境を実現
従来は統一方針なく
独自サービスを構築
アクションプランでは基盤から積み上げるので
サービス構築、連携、更新が容易
サービス
政府のサービス、民間のサービス
府省の
web
サイト
調達
テーマ別
の
・制度
web
情報等の
サイト
改革
民間のweb
サイト
コンテンツ
未整理
Web用の政策関連情報
未整理
新たな利便性の高いサービス
・情報の組み合わせ
・プロセスの見直し
・APIを通じた民間サービス開発
組み合わせ自由な素材群
データ
カタログ
ガバナンス
ルール
ドメイン
コード
用語
文字(整備済み、導入フェーズ)
ハードウェア・基盤ソフト(共通プラットフォーム)
・情報構造の共通化
・見出しデータの共通化
・重要な情報の集積
標準化・共通化した基盤
・基本情報の共通化
・持続的に発展可能な標準の採用
・設計・開発の共通化
13
国際協調
 語彙プロジェクトは、データ連携が進む中で世界的な課題。
 国内外との連携が重要であり、関係各所との意見交換を実施。
4月 ISAとの意見交換@SEMIC2014
6月 OMGとの意見交換@Tokyo(予定)
UN/CEFACTとの意見交換@Tokyo
 7月に米国および欧州との情報交換を実施予定。
14
コア語彙2.0
 コア語彙とドメイン語彙という、基本フレームワークは継承し、コア
語彙の内容を精査。
2013/6/13
コア
適用検証
2014/6/6
コア
地域実証
語彙
1.0
ヒアリング
実証
語彙
普及
2.0
事例収集
専門委員会
ドメイン語彙
防災、地理空間・施設、移動・交通、財務
氏名、住所、AED、施設
子育て、イベント、観光、道路
改定のポイント
・共通語彙の位置づけを、コアドメインの共通語彙から、ドメイン共通語彙へ変更
・共通語彙の位置づけ変更に伴い、ドメイン語彙を、ドメイン共通語彙とドメイン固有語彙に変更
・コア語彙内容の精査・変更
・NIEM、ISAマッピングに加えて、UN/CEFACTへマッピング
15
2014年度の推進方針
 2012年度は、事前調査(検証用の基盤つくり)
 2013年度は、基礎調査とプロト構築
 2014年度は、基盤整備と実利用での検証+利用モデル普及とドメイン展開
 社会的ニーズが高いため、2015年度計画も前倒しで実施
4月
5月
6月
7月
8月
9月
10月
11月
12月
1月
2月
3月
コア語彙
氏名、住所、組織
IEP2.0
施設、設備
IEP2.0
データカタログ構築
情報連携用語彙DB検証
実証
実証結果のIEP化
データカタログ運用
情報連携用語彙DBアジャイル展開
実証、ハッカソン、コンテスト等
電子行政アクションプラン、情報流通基盤共通APIとの連携検討
16