13. 新しいデータベース ≪基本情報処理技術者試験から≫ 問 37 大量に蓄積されたデータから,ビジネスなどに有効な情報を統計学的手法などを用いて新たに見つけ出すプロセスは どれか。(平 20 秋 37) ア データウェアハウス イ データディクショナリ ウ データマイニング エ メタデータ (ウ) ア:誤り データウェアハウスは、データを分析するために、過去の処理内容を格納したデータベースのことである。 イ:誤り データディクショナリは、データベースに保存しているデータの属性、データとの関係、用途、フォーマットな どをファイルとの関係を管理しているものである。 ウ:正しい データマイニングは、大量のデータから統計学や人工知能などのデータ解析の技法を用いて、役に立つ 情報を見つけ出す技術である。 エ:誤り メタデータは、データに関連する情報のことである。データの作成日時や作成者、データの形式などが書か れることが多い。 問 38 データマイニングの説明として,適切なものはどれか。 (平 19 秋 38) ア 大量のデータを高速に検索するための並行的アクセス手法 イ 大量のデータを統計的,数学的手法で分析し,法則や因果関係を見つけ出す技術 ウ 販売実績や製造実績などの時系列データを大量に蓄積するデータベースの保存手法 エ ユーザの利用目的に合わせて,部門別のデータベースを作成する技術 (イ) 今までの分野分類に属さない最近の話題なのだが、ここで挙げておく。たとえば統計学の相関解析などを使って、 未知の法則を見つけ出すなどする。データマイニングは、対象がデータ(数値や属性)である場合を指す。 (余 談)それに対して、対象が文章(テキストデータ)の場合をテキストマイニングと呼ぶ。テキストマイニングは、文の 統計的性質だけでなく、意味を勘案して(たとえば「何を言っているか」)、未知の知識や法則を見つけ出す。 問 63 事務室が複数の建物に分散している会社で,PC の設置場所を管理するデータベースを作ることになった。 “資産”, “部屋”,“建物”の三つの表を作成し,各表の関連付けを行った。新規にデータを入力する場合は,参照される表のデータが 先に存在している必要 がある。各表へのデータの入力順序として,適切なものはどれか。ここで,各表の下線部の項目は, 主キー又は外部キーである。(平 19 春 63) 資産 PC 番号 建物番号 部屋番号 部屋番号 部屋名 機種名 部屋 建物番号 建物 建物番号 建物名 ア 資産 → 建物 → 部屋 イ 建物 → 部屋 → 資産 ウ 部屋 → 資産 → 建物 エ 部屋 → 建物 → 資産 (イ) 何が言いたいのかあまりよく分からない問題だが、『新規にデータを入力する場合は、参照される表のデータが先に 存在している必要がある。』 とある様に、“資産”表は“建物”表と“部屋”表を外部参照、 “部屋”表は“建 物”表を外部参照している。このことよりまず基本となる“建物”表に入力し、 その“建物”表のみを外部参照し ている“部屋”表を入力する。 最後に“資産”表を入力すれば良い。 16 年秋の問 70 と同じ問題 1
© Copyright 2024 Paperzz