CSVファイルの形式変換手順

概要

users.csvファイルを読み込み、氏名を姓・名に分割し、年月日から年・月を抽出して新しい形式のCSVファイルに変換する手順です。

変換前の形式

列名

説明

氏名

フルネーム

鈴木由美

メールアドレス

メールアドレス

user001@example.com

年月日

日付(YYYY-MM-DD形式)

1986-03-10

変換後の形式

列名

説明

氏名の姓部分

鈴木

氏名の名部分

由美

メールアドレス

メールアドレス

user001@example.com

年月日の年

1986

年月日の月

03

作業手順

1. 入力ファイルの確認

users.csvファイルを読み込み、データの形式を確認します。

2. 氏名の分割処理

一般的な日本の姓リストを使用して、氏名を姓と名に分割します。

  • 佐々木、佐藤、鈴木、高橋、田中など約50種類の一般的な姓を照合
  • 長い姓から順に照合することで、「佐々木」などの3文字姓も正しく認識
  • リストに該当しない場合は、最初の2文字を姓として扱う

3. 年月日の分割処理

YYYY-MM-DD形式の年月日を「-」で分割し、年と月を抽出します。

4. 出力ファイルの作成

変換後のデータを新しいCSVファイル(users_converted.csv)として保存します。

注意事項

  • 入力ファイルはUTF-8エンコーディングである必要があります
  • 珍しい姓の場合、分割が正確でない可能性があります
  • 月は2桁のゼロ埋め形式で出力されます(例:03)
最終更新: