名前や住所、あるいは価格など、同種の情報をたくわえたもの、それが「データベース」であり、その情報を活用するシステムが「データベース」ソフトです。
たとえば年賀状ソフトには住所録機能がついていますね? その部分はデータベースソフトです。家計簿ソフトや経理ソフトなどもすべてデータベースソフトです。また表計算ソフトもデータベースソフトの一形態です。 データベースの情報の「活用」のしかたはいろいろあります。 たとえばたくわえられたデータの傾向分析などが上げられます。具体的には家計簿から最近金額が増えている出費項目を調べたり、会員名簿からどこの地方のひとが多いかを調べるなどです。 また年賀状用住所録で、今年喪中のひとにだけマークして、それ以外のひとの分だけ宛名印刷するといった「活用」もできます。 狭義のデータベースソフトとして有名なソフトとしては一般向けにはMicrosoft Access、FileMakerが、企業などが扱う大量データ処理用にはOracleなどがあります。 |
データベースには長期に渡って使いたい大量のデータをためこむことが多いため、ソフトが変わってもデータを移行しやすいように考えられています。
データベースのデータ形式には各ソフト独自の形式の他に、データベース間でデータ交換するための基本的な共通の形式があります。 中でもTSV形式やCSV形式などのテキストファイルはOSのちがいをも乗り越えられ、広く共通性があって、加工も容易です。 |
ほとんどのデータベース類はデータの変換機能(別称:データコンバート機能)を持っています。
■インポート インポートとは他のソフトのデータを利用できる形式に変換する機能です。「外部データ取込」などと呼ばれることもあります。 ほとんどのソフトが同種競合ソフト、たとえば年賀状作成ソフトなら他社の年賀状作成ソフト、表計算ソフトなら他社の表計算ソフトのデータ形式と、データベース類共通の形式のテキストファイルへのインポート機能を持っています。さらにAccessやExcelなどの主立ったデータベースや表計算ソフトのデータのインポート機能を持っているものも少なくありません。 ■エクスポート インポート機能とは逆に他のソフトで利用できる形式に変換する機能がエクスポートです。 主立ったデータベースや表計算ソフト、そしてデータベース類共通の形式のテキストファイルへのアウトポート機能を持っているものがたくさんあります。 |
テキストファイル形式は多くのデータベースソフトで扱えます。
さらにテキストファイル形式なら部分的な加工も容易です。
たとえば、以前の住所録ソフトのデータでは敬称の項目があったのに、新しい住所録ソフトでは不要になった場合、あるいは旧データでは電話番号が1項目だったのを、新データでは市外局番と市内局番に分ける場合など、項目数が異なるため、そのまま持っていくとデータ移行が正しく行なえません。こんなときはテキストファイルにして、ワープロソフトやエディタでデータを修正してから、新しいデータベースに持っていきます。 |
データを加工するためには、まずデータの構造を知っておきましょう。
データベースのデータは行(横の並び)と列(縦の並び)がクロスした、下の図のようなワークシートの形で表すことができます。 ワークシートの1行に1件のレコードが納められています。たとえば住所録ならひとり分の住所や氏名などが入ったデータが1行で表される1レコードです。 列は項目=フィールドを示します。住所録なら、たとえば「氏名」という項目が縦に並んでいます。 行と列がクロスした部分はセルと呼ばれます。たとえば名前のデータ「鈴木一郎」や会社のデータ「株式会社A」が収められた部分がひとつのセルです。 |
CSV形式ではカンマ「,」で列の区切りを、改行で行の区切りを示します。
ひとつのセル内にカンマや改行コードがあると、区切りのカンマや改行コードと区別がつかなくなってしまうため、ひとつひとつのセルの内容は"鈴木一郎"のようにダブルクォーテーション「"」で区切られます。
すると今度はセル内にダブルクォーテーションが含まれる場合が問題になりそうに思えますが、たとえば「"data"file」 なら、「""data"file"」となりますので、通常のデータベースはこれによりセルの区切りを正しく認識してくれます。 上の図のデータをCSV形式に変換すると、次のようになります。 氏名,よみがな,敬称,会社,部署,郵便番号,住所
鈴木一郎,すずきいちろう,様,株式会社あいうえお,宣伝部広告課,100-0001,東京都千代田区千代田0番地 鈴木善幸,すずきぜんこう,様,株式会社かきくけこ,”ヒット”制作局,100-0003,東京都千代田区一ツ橋1丁目 佐久間良子,さくまよしこ,様,株式会社さしすせそ製菓,総務部,123-0851,東京都足立区梅田0の0 田中康夫,たなかやすお,様,株式会社たちつてと商社,人事部,135-0001,東京都江東区毛利0番地 斉藤由貴,さいとうゆき,様,なにぬねの物産株式会社,経理部,987-0001,宮城県遠田郡小牛田町藤ヶ崎00番地 |
タブ区切りのテキストファイルには名前がありません。決まった拡張子もありません。データベースなどのエクスポートの形式にも、まんま「タブ区切りのテキストファイル」という呼び名で出てきます。拡張子は一般的なテキストファイル形式の拡張子「.txt」をつけることが多いようです。
タブ区切りのテキストファイルではタブで列の区切りを、改行で行の区切りを示します。 CSV形式の場合と同様、ひとつのセル内にタブや改行コードがあると、区切りのカンマや改行コードと区別がつかなくなってしまうため、ひとつひとつのセルの内容は"鈴木一郎"のようにダブルクォーテーション「"」で区切られます。 上の図のデータをタブ区切りのテキストファイル形式に変換すると、次のようになります。 氏名 よみがな 敬称 会社 部署 郵便番号 住所 電話 ファクス
鈴木一郎 すずきいちろう 様 株式会社あいうえお 宣伝部広告課 100-0001 東京都千代田区千代田0番地
鈴木善幸 すずきぜんこう 様 株式会社かきくけこ ”ヒット”制作局 100-0003 東京都千代田区一ツ橋1丁目 佐久間良子 さくまよしこ 様 株式会社さしすせそ製菓 総務部 123-0851 東京都足立区梅田0の0 田中康夫 たなかやすお 様 株式会社たちつてと商社 人事部 135-0001 東京都江東区毛利0番地 斉藤由貴 さいとうゆき 様 なにぬねの物産株式会社 経理部 987-0001 宮城県遠田郡小牛田町藤ヶ崎00番地 |
具体的な変換方法を、Excelのデータをテキストファイル形式に変換するケースでご説明しましょう。
1)テキストファイル形式に変換したいExcelデータのワークシートを開きます。 |
2)「ファイル」→「名前を付けて保存」をクリックします。 |
3)「ファイルの種類」の右の▼をクリックすると、保存できるファイル形式の一覧が表示されます。必要に応じてスクロールして、保存したい形式を選びます。この例ではCSV形式=カンマ区切りのテキストファイル形式を選びました。 |
4)保存したいフォルダを選び、適切なファイル名をつけて「保存」をクリックして、保存します。
このときいくつかの警告が表示される場合があります。 ひとつはワークシートに関する警告。テキスト形式の場合はワークシート1枚が1ファイルですので、現在開いているワークシートだけがテキストファイル形式として保存されます。「OK」をクリックすればウインドウが閉じます。 そしてテキストファイル形式で保存すると失われる情報があるという警告。文字の大きさや装飾その他Excelならではの機能で可能な情報などは失われます。「OK」をクリックすればウインドウが閉じます。 ※なおエクセルの場合はデータ内に「"(ダブルクォーテーション)」があると自動的にそのデータ全体をさらに「"(ダブルクォーテーション)」でくくります。 |
テキストファイルの加工はエディタソフトか、ワープロソフトで行います。
エディタソフトはWindowsのOSには「メモ帳」および「ワードパッド」が、MacOSの9までなら「Simple Text」、MacOSのXには「Text Edit」が付属しています。ただし大きなファイルは扱えない場合もあります。 ワープロソフトでも扱えますが、ワープロソフト固有の形式でしか使えない機能を使わないように注意する必要がありますし、保存する際にも通常だとワープロソフト固有形式で保存されるので、きちんと形式をテキストファイル形式に変更して保存するように注意しましょう。 エディタソフトはプログラマーには不可欠のソフトですが、それ以外でも文字入力やWebデザインの仕事をするひと、ライターや編集者など出版関連の仕事をするひとはぜひ持っておきたいソフトです。 データベースの加工の例としては、たとえば元のデータでは住所をひとつに扱っていたものを、都道府県と以下の2つに分けるなどが考えられます。「東京都」を「東京都,」に、「県」を「県,」に…などと変換すれば、大きなデータも比較的簡単に加工が行えます。 |
【元データ】 |
【加工後データ】 |
テキストファイル形式のデータベースファイルをMicrosoft Excelで扱うためには、特にインポート(取り込む)の変換作業などは不要です。ただ単純にExcelでそのファイルを開けます。
1)Excelを起動して、「ファイル」→「開く」をクリックします。 |
2)「ファイルの種類」の右の▼をクリックすると、開けるファイル形式の一覧が表示されます。必要に応じてスクロールして、「すべてのファイル」または「テキストファイル」を選びます。するとフォルダ内のテキストファイルも表示されますので、開きたいファイルを選んでカーソルを合わせて反転させてから、「開く」をクリックして開きましょう。 |