カテゴリー:
Q&Aサイト
閲覧数:90 配信日:2023-04-11 00:25
「教えて!goo」スクレイピングの後処理
1.「質問タイトル」「質問日時」「質問URL」「回答件数」だけの 4 列データファイルを作成します。
レコードによっては、列位置がズレているか所があるため、いきなり不要列を削除してはいけません。
1-1.URLがあるN列を基準として、昇順で全列を並べ替え
1-2.「,が含まれるタイトル」は位置がずれていることがあるため、左側セルを手動で削除。
1-3.必要データを含む列が揃ったら、不要列を一気に削除
2.4 列CSVデータファイルをPHPファイルで読み込み、HTMLファイルとして出力
その際、2列目と3列目よりaタグ作成。
ソースコードおよびデモは、「PHPデモ」の「CSV読込(バナーリンク集)」2 に配置しています。
※「Yahoo!知恵袋」スクレイピング結果も同じように処理しました。
CSVファイルを、含まれているデータを利用したaタグ入りのCSVファイルへ変換したい