なにからなにまでてけとーです。


by 言壺

そのうちテラバイトか。

複数あるデータのインデックスをHTMLで作成と、開き方の設定を統一するという仕事。インデックスはテキストデータがあるから置換で書き換えすぐだし、開き方の設定もバッチ処理で一括変換する。もしかして半日で終わっちゃうんじゃね?わーいらくちんなしごとじゃん!


…とか思ってたが甘かった。



データ量がはんぱないっす。
えっと。全部で約2500件分、容量にして300GB。
300GBて。
びゃくギガバイトて。

なかにはですね、一ファイルで1GBを軽く越えているのもございまして。
一ファイルで1GB越え。

今一度。
一ファイルで1GB越え。

いや書籍をスキャンしてPDF化したデータが多いのでALL画像だから重いのは分かるんだけど1GB越え、て。(しつこい)


バッチも量がおおすぎて処理しきれず、少しずつ。
リンクの検証をするも、対象データが開くまでに時間がかかるので待ち時間に軽く意識を失いかけております。
ようするにこれに数日かかりっきりです。ねむい。



さて。
エキブロさんは最近元気がないご様子ですね。
今日も25時から緊急メンテらしいです。
がんば!


[PR]
Commented by fctokyo1999 at 2006-06-09 00:49
GB越えのファイルってどーするとできるんでしょ?
ちょっとショーブしてみよって思ったんですが,どーするとGBって単位になるのか悪戦苦闘中でっすぅ.
ホント1GBページくらい書かなきゃならないんじゃないかと.ウム奥が深いですわ
Commented by kototubo at 2006-06-10 23:33
■fctokyoさん 3000ページぐらいの書籍をスキャンして画像化→PDFにすると、見事それぐらいです。
Commented by fctokyo1999 at 2006-06-11 00:38
もっぺんでーす.3KBページ?って枕になりそうな書籍ですな.
スキャンをPDFで保存ってそんな素敵な作戦なのですか,JPGにしといてOCRかければってわけにいかないのですね.挿絵がとれないか・・・
今度PDFとPSで渡してみよっかなと考え中でーす.
by kototubo | 2006-06-09 00:06 | しごと。 | Comments(3)