CSVファイルの形式変換手順
概要
users.csvファイルを読み込み、氏名を姓・名に分割し、年月日から年・月を抽出して新しい形式のCSVファイルに変換する手順です。
変換前の形式
列名 | 説明 | 例 |
|---|---|---|
氏名 | フルネーム | 鈴木由美 |
メールアドレス | メールアドレス | user001@example.com |
年月日 | 日付(YYYY-MM-DD形式) | 1986-03-10 |
変換後の形式
列名 | 説明 | 例 |
|---|---|---|
姓 | 氏名の姓部分 | 鈴木 |
名 | 氏名の名部分 | 由美 |
メールアドレス | メールアドレス | user001@example.com |
年 | 年月日の年 | 1986 |
月 | 年月日の月 | 03 |
作業手順
1. 入力ファイルの確認
users.csvファイルを読み込み、データの形式を確認します。
2. 氏名の分割処理
一般的な日本の姓リストを使用して、氏名を姓と名に分割します。
- 佐々木、佐藤、鈴木、高橋、田中など約50種類の一般的な姓を照合
- 長い姓から順に照合することで、「佐々木」などの3文字姓も正しく認識
- リストに該当しない場合は、最初の2文字を姓として扱う
3. 年月日の分割処理
YYYY-MM-DD形式の年月日を「-」で分割し、年と月を抽出します。
4. 出力ファイルの作成
変換後のデータを新しいCSVファイル(users_converted.csv)として保存します。
注意事項
- 入力ファイルはUTF-8エンコーディングである必要があります
- 珍しい姓の場合、分割が正確でない可能性があります
- 月は2桁のゼロ埋め形式で出力されます(例:03)
最終更新: