カレンダー

2024/04
 
1920
21222324252627
282930    
       

広告

Twitter

記事検索

ランダムボタン

魔法のように

by 唐草 [2022/06/11]



 カッコよく正規表現を使えるようになっただろうか?
 数千行のデータを整形処理しているときにそんなことを考えていた。
 ぼくが初めて正規表現の威力を知ったのは大学生の頃。当時、ぼくの指導教官はコマンド操作しかなかった時代にネットワーク業界の最前線に立っていた技術者だった。余談になるが、その先生の凄さを理解できたのは大学を卒業したずっと後のこと。先生の名前を出すだけで「あの先生に指導されているならOK」と面接をパスできるレベルだった。
 その先生が、形式の異なる大量の名簿を渡され呆れていた。エクセルやテキストが混在しているような形式の違いではない。すべてCSVだったが、問題は中身にあった。氏名より先に学籍番号が記載されているファイルもあれば逆もある。氏名の読み仮名の有無もファイルによって異なっていた。必要なデータが含まれているとは言え、レコード単位で見るとデータの順番も種類もまちまち。
 エンジニアからしたら整形されていない生データほど厄介なものはない。そのままでは機械で処理できないからだ。
 当時のぼくだったら1ファイルずつエクセルで開いてチマチマ整形していただろう。CUI時代を戦い抜いた先生は違った。
 複雑な正規表現をスラスラと書き上げ、ファイルを処理していったのだ。わずか数分で目的のデータを抽出していた。GUIよりCUIのほうが速いというのを初めて目にした瞬間でもあった。
 その様子は、学生だったぼくには魔法のように見えた。正規表現は、さながら呪文といったところ。
 あれから何年経っただろう?ぼくの目の前には、セル結合された人の目には美しくとも機械には忌諱されるデータが転がっていた。これを機械に都合のいい形式にするのがぼくの使命。
 選んだ方法は、正規表現検索による置換を基本とした整形だった。
 のべ4つの正規表現を組み合わせて数千行を処理した。当時は魔法に見えたスキルも、仕掛けがわかれば自分でもそこそこ使いこなせる。
 今の学生が、ぼくの処理を見たら当時のぼくのように「魔法みたい!」と目を輝かせてくれるだろうか?
 まだ、自信はない。