2match.exe
2つのデータを共通タームを用いてマッチングします。
2017.4.17

プログラム:2match.exe.zip (Windows) /  2match.zip | 2match-utf.zip (OSX10.7)

入力データ例:A: a-dat.csv (109データ) B:b-dat.csv (229データ)

出力データ例:b-dat.2MATCH.csv

*ダウンロードは 右クリック して「リンク先を保存」などを選んで下さい。入力・出力例はテキストなので、メモ帳などで開くことができます。


入力データについて

> 入力データはcsv形式で、データ/行のデータは最大6個まで。
 全て文字列として読み込みます。

a-dat.csv: 大阪の高校名+ランダム数値、文字など5つのデータ(109校分)

  プール学院,12,3.10,R,6260C
  阿倍野,10,6.23,K,4652D
  茨木,7,2.88,E,3141R
  茨木西,5,7.68,T,1277C
  河南,10,5.82,L,2543O
  花園,4,2.12,G,1480U
   ...
 (データに数字も入っていますが、文字として取り扱います。)

b-dat.csv: 近畿の高校名+ランダム数値、文字など4つのデータ(229校分)

  桃山学院,98.84,9298,IVVT
  金蘭千里,38.89,1994,RYEN
  須磨学園,14.57,4348,CFLA
  智辯学園和歌山,64.08,9163,ILKS
  京都成章,22.73,6280,LGNA
  大谷,92.67,7059,FGIE
   ...
 (データに数字も入っていますが、文字として取り扱います。)

Macでは改行コードに注意して下さい。CR になっていると読めません。LF または CR+LF に変更する必要があります。テキストエディター mi などで確認・変更して下さい。

> ここでは、データAとBの高校名(第1カラムデータ)を比較して、、、
 (1)一致したら:AとBのデータを統合
 (2)Aのデータに、Bと一致するものがない:Aのデータだけ出力
 (3)Bのデータに、Aと一致するものがない:余ったBのデータを最後にリスト
します。

> データの並びはAが基準です。
 Aのデータが名簿であれば、色々なデータを 2match でAに統合できる並びに出力できます。

使い方

 ====================================================
  2種類のデータセットをマッチングします。 
 ====================================================
  [170413]

  マークシートデータは CSV 形式で各行1データです。

   例:     27101C,北野, 13
           27116A,茨木, 20
           26539A,京都成章, 8
           26529C,京都共栄学園, 4
            … 

   第1カラムがreference
   全て文字列 全角20字
   最大6データ/行

 データA > a-dat.csv

          → データAは  110 行ありました。


 データB > b-dat.csv

          → 結果は b-dat.2MATCH.csv  に保存されます.    ← 結果の出力ファイル

          → データBは  230 行ありました。

          → データBで、Aにマッチしなかったデータ数 > 164


          終了しました。リターンしてください・・・・[CR]



出力ファイル

b-dat.2MATCH.csv をExcelで開くと次のようになります。

A1が比較したデータ(第1カラムデータ)、A2〜A5が a-dat.csv のデータ、B2〜B4が b-dat.csv のデータ。もし、一致データがない場合、13行目のようにB1〜B3か空白になります。




b-dat.csv で、 a-dat.csv と一致しない余ったデータは、最後にまとめて出力されます。このとき、第1カラムデータ(B1)は b-dat.csv だけにあるものです。A2〜A5に相当するカラムは空白です。


 □ □ □