えふすくBlog　いろいろ実験室: 9月 2012

2012年9月26日水曜日

えふすく流　Firefox版・フォントが変わって読みにくくなった「Facebookのフォント」を変更する方法

Firefox版・フォントが変わって読みにくくなった「Facebookのフォント」を変更する方法
http://www.lifehacker.jp/2012/09/120926meiryofirefox.html

という話を聞いて。自分はすべてのサイトでメイリオを使うスタイルシートを使用してるので、応用が利くんじゃないかと思った。

もちろんStylishが前提で

これがすべてがメイリオになるスタイルシート。これをFacebook限定にしたいのなら……

こうしとけばいいんじゃない？

使ったことないので、ホントにこの範囲で大丈夫かはわかんない（自分で調整してね）けど、この方法ならフォント名がわかる限りいくらでも応用が利くので便利ですよー。

ちなみにえふすくはFacebook使ってませんけどねｗ

コピペ用ソース

@namespace url(http://www.w3.org/1999/xhtml);

@-moz-document domain("facebook.com") {

*{
    font-family:meiryo !important;
}

}

ついでなのでuserstyles.org にも登録。こちらはワンクリックで導入可能

userstyles.org - Facebookだけフォントをメイリオにする
http://userstyles.org/styles/75562/facebook?r=1348667512

■

2012年9月22日土曜日

Firefox 16 Beta 4が出たので、Windows8上でもう一度Octane Scoreを計測した件

Firefox 16 Beta 4

仮想マシン（VirtualBox）にWindows8RPをインストールして、
例によって面倒なのでキャッシュの削除などは行っていない。

Octane JavaScript Benchmark
http://octane-benchmark.googlecode.com/svn/latest/index.html

Windows8上でもう一度Octane Scoreを計測した件
http://ccf-squarelab.blogspot.jp/2012/09/windows8octane-score.html

	1回目	2回目	3回目	4回目	5回目	平均
Octane Score	5501	5706	5327	5798	5762	5618.8
Richard	8370	8116	8010	7961	8264	8144.2
Deltablue	6050	6539	6089	6797	6579	6410.8
Crypto	13694	12931	13585	13232	13414	13371.2
Raytrace	2905	2829	2866	2957	2835	2878.4
EarleyBoyer	7358	7302	7066	7355	7335	7283.2
Ragexp	1037	1048	1006	1029	1036	1031.2
Splay	8043	6715	5221	6022	6524	6505
NavierStokes	8828	7857	7974	8342	6287	7857.6
pdf.js	4800	4113	3194	4047	4323	4095.4
Mandreel	2722	5303	5338	5442	5528	4866.6
GB Emulator	4322	7108	7059	7087	7276	6570.4
CodeLoad	10092	10026	5867	9292	9706	8996.6
Box2DWeb	7287	6832	7014	7172	7096	7080.2

Firefox 16 Beta 3

	1回目	2回目	3回目	4回目	5回目	平均
Octane Score	5427	5794	5258	5524	5647	5530
Richard	8268	8328	8091	6167	8317	7834.2
Deltablue	6532	6534	6572	6461	5530	6325.8
Crypto	12016	13581	13550	12688	13468	13060.6
Raytrace	2832	2787	2860	2846	2577	2780.4
EarleyBoyer	5961	7114	7089	7141	6526	6766.2
Ragexp	932	1032	995	1007	970	987.2
Splay	6201	6445	3643	6516	6992	5959.4
NavierStokes	7339	7950	4171	6452	8253	6833
pdf.js	3934	4021	5258	3926	3753	4178.4
Mandreel	4136	5556	5354	5344	5479	5173.8
GB Emulator	6772	6957	6667	6857	6902	6831
CodeLoad	9602	10053	10162	10178	10147	10028.4
Box2DWeb	7201	7048	5851	7000	7075	6835

Firefox 16 Beta

	1回目	2回目	3回目	4回目	5回目	平均
Octane Score	5846	5814	5880	5824	5461	5765
Richard	8282	8310	8102	8310	8204	8241.6
Deltablue	6599	6506	6374	5990	6162	6326.2
Crypto	13415	13015	13961	13625	6512	12105.6
Raytrace	2866	2695	2787	2806	2846	2800
EarleyBoyer	7207	7041	7086	7285	7291	7182
Ragexp	1052	1001	1043	1004	1057	1031.4
Splay	6637	6042	6511	6747	6430	6473.4
NavierStokes	7663	8057	8204	8228	8302	8090.8
pdf.js	4136	4278	4335	3893	4014	4131.2
Mandreel	5600	5496	5618	5594	5374	5536.4
GB Emulator	7972	8123	7235	7287	7108	7545
CodeLoad	9341	10508	10601	10466	9401	10063.4
Box2DWeb	6672	6646	6784	6914	6908	6784.8

結論：うーん、キャッシュ力が効いてる可能性大かも

前回よりあからさまに低い数値が主に1回目と3回目に出てる件。
おかげでこれを除けばIron系にも肉薄できそうだけど、実際キャッシュ切ったら全項目減少したのでそれはないか……グラフで見る限りでは成長してる箇所はありそうだ。

■

2012年9月18日火曜日

gImageReader＋resseract-ocr-jpnのインストールの仕方

UbuntuでのOCRソフト「gimagereader」の威力を試してみた件
http://ccf-squarelab.blogspot.jp/2012/09/ubuntuocrgimagereader.html

で肝心の「gImageReader＋resseract-ocr-jpn」のインストール方法を別のエントリで解説するということで、このエントリを用意した。

方法としてはWindowsでもUbuntuでも「gImageReader」と「resseract-ocr-jpn」のパッケージを見つけてインストールすればよいのだが、日本語を読み取りたい場合はいろいろと設定が必要になる。ただこれもファイル位置やボタンによるもので設定ファイルをテキストエディタで弄るという性質のものではないのでかなり敷居は低いはずだ。

インストールの流れ

インストールに関しては順序はほぼ無視できるが、一応resseract-ocr-jpnを先に入れるとgImageReaderをインストールしたときに使用するエンジンとして自動的に設定してくれる（逆でもやってくれるとは思う）ので気分的にラクになる。

それでは各項目について

gImageReader（deb/exe）を取得する　【共通】

Ubuntuの場合、私の手元にあった資料ではapt-getで両方ともインストールできたはずなのだが、現在gImageReaderはできないので直接debパッケージをインストールすることになる。

ダウンロード - gimagereader - SourceForge.JP
http://sourceforge.jp/projects/sfnet_gimagereader/releases/

Ubuntuの人はdeb、Windowsの人はexeをダウンロード。Windowsの場合はgimagereader-win32-support-0.6.zipをダウンロードして展開上書きするのもアリかも。

※Windows版ではこんなのもあるけど……

Index of /~smani/download/gimagereader
http://n.ethz.ch/~smani/download/gimagereader/

Resseract-ocr-setup.exe、jpn.traineddataを取得する　【Windowsのみ】

Windowsの場合はさらに最新のResseract-ocr-jpn.exeをダウンロード

tesseract-ocr
http://code.google.com/p/tesseract-ocr/downloads/list

現在はtesseract-ocr-setup-3.01-1.exeが最新。あと日本語を対応させるための学習ファイルjpn.traineddata.gz もダウンロード。

Resseract-ocr-jpnをインストール　【Ubuntuのみ】

これはソフトウェアセンターで検索すると出るので一発インストール

GimageReader.debをインストール　【Ubuntuのみ】

debファイルなので普通にインストール。これでUbuntu環境でGimageReaderを使えるはず。

Resseract-ocr-setup.exeをインストールする【Windowsのみ】

起動すればそのままインストーラが立ち上がるので従う。インストール場所はえふすくの個人的にDドライブにしてある

jpn.traineddataをセットする　【Windowsのみ】

Windows版のResseract-ocrは日本語の学習ファイルがデフォルトで入っていないので、前の段階でダウンロードした圧縮ファイルを解凍して得たjpn.traineddataをインストール先のTesseract-OCR\tessdataフォルダに入れる。

GimageReader.exeをインストール　【Windwosのみ】

これも起動すればそのままインストーラが立ち上がるので従う。同じくインストール場所はDドライブにしてある。

日本語読取用設定を行う　【共通】

この状態で、gImageReaderを起動すると次の画面が出るので日本語を設定する。

※赤部分が空白の場合は前述のTesseract-OCR\tessdataフォルダまでのパスを入れる。

Preferred laungageを選択できるようになるので「日本語」→「ja_JP」を選択

「language」タブでは当然日本語を選択して「Apply」する

あとは画像を開くなりスキャナを経由するなりして認識させることができる

※ファイルパス、ファイル名に日本語が入っていると読み込めないので注意。
※どちらかというと画像は別にスキャンしておいた方がいいと思う。

■

Firefox 16 Beta 3が出たので、Windows8上でもう一度Octane Scoreを計測した件

Firefox 16 Beta 3

仮想マシン（VirtualBox）にWindows8RPをインストールして、
例によって面倒なのでキャッシュの削除などは行っていない。

Octane JavaScript Benchmark
http://octane-benchmark.googlecode.com/svn/latest/index.html

Windows8上でもう一度Octane Scoreを計測した件
http://ccf-squarelab.blogspot.jp/2012/09/windows8octane-score.html

	1回目	2回目	3回目	4回目	5回目	平均
Octane Score	5427	5794	5258	5524	5647	5530
Richard	8268	8328	8091	6167	8317	7834.2
Deltablue	6532	6534	6572	6461	5530	6325.8
Crypto	12016	13581	13550	12688	13468	13060.6
Raytrace	2832	2787	2860	2846	2577	2780.4
EarleyBoyer	5961	7114	7089	7141	6526	6766.2
Ragexp	932	1032	995	1007	970	987.2
Splay	6201	6445	3643	6516	6992	5959.4
NavierStokes	7339	7950	4171	6452	8253	6833
pdf.js	3934	4021	5258	3926	3753	4178.4
Mandreel	4136	5556	5354	5344	5479	5173.8
GB Emulator	6772	6957	6667	6857	6902	6831
CodeLoad	9602	10053	10162	10178	10147	10028.4
Box2DWeb	7201	7048	5851	7000	7075	6835

Firefox 16 Beta

	1回目	2回目	3回目	4回目	5回目	平均
Octane Score	5846	5814	5880	5824	5461	5765
Richard	8282	8310	8102	8310	8204	8241.6
Deltablue	6599	6506	6374	5990	6162	6326.2
Crypto	13415	13015	13961	13625	6512	12105.6
Raytrace	2866	2695	2787	2806	2846	2800
EarleyBoyer	7207	7041	7086	7285	7291	7182
Ragexp	1052	1001	1043	1004	1057	1031.4
Splay	6637	6042	6511	6747	6430	6473.4
NavierStokes	7663	8057	8204	8228	8302	8090.8
pdf.js	4136	4278	4335	3893	4014	4131.2
Mandreel	5600	5496	5618	5594	5374	5536.4
GB Emulator	7972	8123	7235	7287	7108	7545
CodeLoad	9341	10508	10601	10466	9401	10063.4
Box2DWeb	6672	6646	6784	6914	6908	6784.8

結論：Firefoxだと振れ幅が激しいベンチですね

……ってBeta1より数値低いぞ。最低値を除けばかなり変わるのかな。
前回の結果を見る限り、ここまでブレるのはFirefox系くらいなものなんだけど……
キャッシュ削除すれば変わるのかなぁ……

■

2012年9月17日月曜日

UbuntuでのOCRソフト「gimagereader」の威力を試してみた件

実はWindowsでなくても自炊はできる！

条件としてはスキャナにUbuntu（Linux）用ドライバがあるかどうかだけど、一応EPSONはここ

EPSON Download Center
http://download.ebz.epson.net/dsc/search/01/search/?OSC=LX

Canonは正直よくわからない。Linuxで使いたいならえふすくはEPSONをオススメする。

もちろん若干メーカーが認めてるような感じなだけであって動作ができるかどうかの責任は取らない。ただWindowsではできなかったスキャナビボタン（押せば1回分のスキャンが始まる連続スキャンには垂涎の機能）がLinux用では動いたので作業的にはUbuntuでやる方がラクになった（ただし時間はかかる）

問題はOCRだー！

実際「画像が撮れりゃOCRなんぞ要らんだろ」というブコメもいただいたが、あくまで電子書籍を作るのが目的だったし、そのためにどれだけの労力がかかるのか身をもって知ることが大事と考えた。
で、その結果はもう出たので読者のみなさんがマネする必要は一切ない。むしろ無駄だからしなくていいと思うｗ

で、えふすくにとっての重要な問題点であるのOCRだが、購入した読んdeココのほかにCanonのスキャナについていた読取革命Liteというソフトもある。

とりあえずこの２大ソフトが双璧なわけだが、両方使える以上どっちが使えるのか比較してみようと思った。
そしてUbuntuにもgImageReader＋resseract-ocr-jpnという日本語が使えるオープンなOCRソフトがあったのでこれも比較対象に入れてみた。
ただし導入はちょっと面倒だったので、ここでは解説しない（滅殺）　別のエントリで詳細を伝える予定。

【追記】できました

gImageReader＋resseract-ocr-jpnのインストールの仕方
http://ccf-squarelab.blogspot.jp/2012/09/gimagereaderresseract-ocr-jpn.html

ではOCR対象を発表しよう！

ホンモノの文章（改行は画像に準ずる）

186
尿道に浮いた先走りを吸い立てる、スィーリア。
（う、うぅぅっ……も、もうすぐっ……出る……！）
　腰の芯から脳天にまで、繰り返し繰り返し突き抜ける肉悦楽を与えてくれる彼女の顔は、
きっとまた蕩けきっていて、鼻先を伸ばし貪欲にペニスに食いついているのだろう。想像
するほどに、もっと淫らにしてやりたい──湧いた新たな欲求が、ギリギリのところで射
精の予兆を抑え込んだ。
　──といっても、射精が間近に迫っていることに変わりはない。ほんのわずか、その時
を先伸ばしにしたに過ぎなかった。
「ぢゅちゅ……っ！」
　ゆえに手早く、がむしゃらに。顔の上に乗る黒いショーツに、伸ばした舌を這わせ、唾
液をベットリまぶし、舐めしゃぶる。
「んぷぁ……!?　ぁんっ、た、貴弘っ。今日は私が奉仕をするとッ、やっ、あ、あぁ、っ
く、あぁ……ん－っ！」
（甘くって……ネバネバで、ぅあ、あぁっ、意識が飛んじゃいそぉっ……）
　鼻から息を吸えば、スカート内に充満した恋人の香りばかりが肺の中へ流入した。小さ
く薄い、汁濡れの股布を脇に押しのけ直接割れ目をねぶり始めた舌先は、吸いつく間もな
く止め処ない蜜で浸され、飲んでも飲んでもあふれてくる甘酸っぱい味わいに、今にも溺

二次元ゲーム文庫11　ワルキューレロマンツェ[スィーリアの恋物語] の186ページ。
メイドコスになったスィーリアがおっぱい丸出しで貴弘と69するシーン。

以前もこんな感じのシーンを使いましたが、もともと私の自炊はエロラノベの電子化が目的なのと、こういう「……」みたいな記号や「んーっ！」みたいな誤変換の多そうな文章ってこういう小説の方が当然見つけやすいわけで。と言い訳します。

画像はここに上がったものをそのまま使って各ソフトに入力（全部画像からの入力が可能というのはスキャナを問わないという意味では便利）して、OCRした結果をそのままコピペ（改行コードについてはWindwosに合わせて置換）で結果報告。

読んdeココ　Ver.13

認識結果

186
尿道に浮いた先走りを吸い立てる、スィーリア。
（う、うぅぅつ……も、もうすぐつ……出る……⊥
　腰の芯から脳天にまで、繰り返し繰り返し突き抜ける肉悦楽を与えてくれる彼女の顔は、
きっとまた蕩けきっていて、鼻先を伸ばし貪欲にペニスに食いついているのだろう。想像
するほどに、もっと淫らにしてやりたい1－痛いた新たな欲求が、ギリギリのところで射
精の予兆を抑え込んだ。
　－　といっても、射精が間近に迫っていることに変わりはない。ほんのわずか、その時
を先伸ばしにしたに過ぎなかった。
「ぢゅちゅ……つ！」
　ゆえに手早く、がむしゃらに。顔の上に乗る黒いショーツに、伸ばした舌を這わせ、唾
液をベットリまぶし、舐めしゃぶる。
「んぷぁ……け‥ぁんっ、た、貴弘っ。今日は私が奉仕をするとッ、やっ、あ、あぁ、つ
く、あぁ……ん－つー」
（甘くって……ネバネバで、うあ、あぁっ、意識が飛んじゃいそぉっ……）
　鼻から息を吸えば、スカート内に充満した恋人の香りばかりが肺の中へ流入した。小さ
く薄い、汁濡れの股布を脇に押しのけ直接割れ目をねぶり始めた舌先は、吸いつく間もな
く止め処ない蜜で浸され、飲んでも飲んでもあふれてくる甘酸っぱい味わいに、今にも溺

【感想】さすがの検出率である。大文字・小文字の区別はさすがに手作業が必要だが、縦書き特有の「!?」→「け‥」、「！）」→「⊥」あたりは1000ページ近くもやってるともうクセとしてマクロに登録して処理がしてる程度だ。

読取革命Lite 1.2.00

認識結果

186
尿道に浮いた先走りを吸い立てる、スィーリア。
　（う、うううっ……も、もうすぐっ……出る……！・）
　腰の芯から脳天にまで、繰り返し繰り返し突き抜ける肉悦楽を与えてくれる彼女の顔は、
きっとまた蕩けきっていて、鼻先を伸ばし貪欲にペニスに食いついているのだろう。想像
するほどに、もっと淫らにしてやりたい１湧いた新たな欲求が、ギリギリのところで射
精の予兆を抑え込んだ。
　―といっても、射精が間近に迫っていることに変わりはない。ほんのわずか、その時
を先伸ばしにしたに過ぎなかった。
　「ぢゅちゅ……つ！」
　ゆえに手早く、がむしやらに。顔の上に乗る黒いショーツに、伸ばした舌を這わせ、唾
液をベットリまぶし、翫めしゃぶる。
　「んぷあ……り‥　あんつ、た、貴弘っ。今日は私が奉仕をするとツ、やっ、あ、ああ、つ
く、ああ……ん１つ！」
　（甘くって……ネバネバで、うあ、ああっ、意識が飛んじやいそおっ……）
　鼻から息を吸えば、スカート内に充満した恋人の香りばかりが肺の中へ流入した。小さ
く薄い、汁濡れの股布を脇に押しのけ直接割れ目をねぶり始めた舌先は、吸いつく間もな
く止め処ない蜜で浸され、飲んでも飲んでもあふれてくる甘酸っぱい味わいに、今にも溺

【感想】廉価版とはいえ読んdeココ並みの精度を持っているお買い得ソフトかもしれない。他の機能が読んdeココ並みに使えるならばCanonユーザーはこっちをアップグレードした方が安上がりかも。
ただこちらは漢字の誤認がほとんどなく、記号や大文字・小文字ミスがほとんどなので、目立つ部分をマクロで処理、というわけにはいかなさそうなのが残念だ。

gImageReader＋resseract-ocr-jpn（Ubuntu）

認識結果

尿道に浮ぃた先走りを吸い立てる、スイーリァ。

()っ、 }つ)っ、っっ・・・・ '.も、も'っすぐっ・・・・〟.出る ' ' ' . ・ - ー')

腰の縄心から脳天にまで、繰り返し繰り返し突き抜ける肉悦楽を与)ぇてくれる彼女の顔は丶
きっとまた蕩けきっていて、鼻先を伸ばし貪欲に。ヘ一{スに食いついてぃるのだろ}っ。想像
するほどに、もっと淫らにしてやりたぃー湧ぃた新たな欲求が、ギリギリのと,」ろで射
精の予兆を抑)ぇ込んだ。

ーといっても、射精が間近に迫っている,」とに変ゎりはない。ほんのゎずか、その時
を先伸ばしにしたに過ぎなかった。

「ぢゅちゅ .... ・-っ"」

ゅ,ぇに手早く、がむしゃらに。顔の上に乗る黒い`ンョーツに、伸ぱした舌を濃縄ゎせ、唾
液をベットリまぶし、舐めしゃぷる。

「んぷぁ .... ・-m〝ぁんっ、た、貴弘っ。ムゥ日は私が奉仕をするとッ、ゃつ、ぁ、ぁぁ、っ
く、ぁぁ・・・・ ,ーんーつー・」

(甘くって ---- ・.ネ〟ハネ〟ハで、 )っぁ、ぁぁっ丶意識が飛んじゃいそぉっ .... ・.)

鼻から息を吸.乙ば丶スヵート内に充満した恋人の香りぱかりが肺の中ヘ流入した。小さ
く薄ぃ、汁濡れの股布を脇に押しのけ直接割れ目をねぶり始めた舌先は、吸いつく間もな
く止め処ない蜜で浸され、飲んでも飲んでもぁふれてくる甘酸っぱい味ゎぃに、ムゥにも溺

【感想】さて、いよいよオープンソフトの出番なのだがかなり残念な結果になってしまった。特に記号や喘ぎあたりの認識が完全に狂っている。漢字の認識にも問題が残っているようだがこれは市販品を考えるとまだまだ向上の余地はありそうだ。「こ」→「.」」「今」→「ムゥ」あたりのパターンも目立つ

gImageReader＋resseract-ocr-jpn（Windows）

認識結果

尿造に浮いた先走りを吸い立てる、スイ1リァ°
っつ、、つううつ・・・・・・も、も_つすぐつ ____ I I I I ` _
l憂v
腰の芯から脳天にまで、繰り返し繰り返し突き抜ける肉悦楽を与ぇてくれる彼女の顔は
きつとまた蕩けきっていて丶鼻先を伸ばし貪欲にペニスに食いつぃているのだろうo 想像
するほどに、もっと淫らにしてゃりたぃl湧いた新たな欲求が丶ギリギリのところで射
糟の予兆を抑え込んだo
|lとぃつても、射糟が間近に迫つていることに変ゎりはなぃ°ほんのゎずか、その時
を先伸ばしにしたに過ぎなかつたo
芍ぢゆちゆ ____ :っ'屮ー
ゆえに手早<、がむしやらにo顔の上に乗る黒いシヨ竇ッに、伸ぱした舌を這ゎせ、睡
液をべットリまぶし、舐めしゃぷるo
門んぷぁ ____ :瞬あんっ、た、貴弘つ。今曰は私が奉仕をするとッ、やつ、あ、あぁ、つ
ノ\ ああ ____ :んlつ`こ
ハ甘<つて ____ =ネバネバで、うあ、ぁあつ、意識が飛んじゃいそぉつ ____ 上
鼻から息を吸ぇば丶スヵ1ト内に充満した恋人の香りぱかりが肺の中へ流入した°小さ
<簿い、汁濡れの股布を脇に押しのけ直接割れ目をねぷり姶めた舌先は丶吸ぃつ<間もな
<止め処ない蜜で浸され、飲んでも飲んでもあふれて<る甘酸っぱい昧ゎぃに、今にも溺

【感想】実はgImageReader＋resseract-ocr-jpnにはWindows版がありUbuntu版に比べるとresseract-ocr-jpnのバージョンが若干高い。そのせいなのか認識率は向上しているがやはり「く」→「<」や句読点の誤変換など修正が面倒なモノが多く実用的とは言い難い。
ただ、ここまで向上が可能ならば今後のバージョンアップも期待していいのかもしれない。
　※オレンジ部はなんなのだろうか

まとめ

市販品では差がないから、買った方についてたものをアップグレードがいいと思う。
でも手作業での校正をラクにしたかったらクセの読める読んdeココかな。
gImageReader＋resseract-ocr-jpnは向上の余地もあるし、思ったより漢字の精度は高い。Windowsでも使えるのは朗報なので安物が駆逐できるくらいはレベルアップしてほしい。

■

2012年9月13日木曜日

TwitterのRT/Fav相手をほぼ網羅する方法

私はTweetDeck使いだが、最近RTやFavの人数だけになってしまい、誰がRT/Favしているのかわからなくなった。

ということでTwitterから見ることになるのだが、こちらも9人が限度で、しかもRTとFavの区別がつかない。

いったいどうすればいいんだ。と思ったのだが、数字があるということはその先にその内容があるのではないか、と気が付いた。

つまりここである。

するとRTしてくれたメンバーの一覧が表示される

フォローボタン等があるのでそのままフォローするもよし、名前部分のリンクをホイールクリックすればこの画面のまま別のタグにそのメンバーのページを覗けたりするので取捨選択にとても役立つ。ただ人数が多いと全員とはいかないようだ。

もちろんお気に入りの数字をクリックすれば、RTと同様にお気に入りにしてくれた人の一覧を表示することもできる。

きっとみんな気づいていることだが、自分はこれのためにFavStarに29ドル払ってしまった阿呆なので、こうでもしないと溜飲が下がらないのだ（滅殺）

■

エロラノベの自炊をしてみた記録その３【完結編？】

エロラノベの自炊をしてみた記録その２
http://ccf-squarelab.blogspot.jp/2012/09/blog-post_11.html
の続きです

今度こそ作成したHTMLからEPUBやその他の電子書籍用フォーマットを生成する段階。
ツールは電子書籍の生成と管理を行える

calibre - E-book management
http://calibre-ebook.com/

を採用。えふすくはPortable版を使ってPortableAppsのランチャー経由で使えるようにしている。

①　まず、問題のHTMLをドラッグ＆ドロップでcalibreに登録する

送るのはHTMLファイルだけでいい。

登録が完了すると、これはHTMLファイルと画像ファイルをまとめてZIPに圧縮したものとして保管される。

②　書籍情報を編集する

編集したい書籍を右クリック、[書誌を編集]→[書誌情報を個別に編集]を選択すると書誌編集画面が現れる。

ここで必要な情報を入力する。必要なものは

タイトルとタイトルソート
著者と著者ソート

この2つを入力した後、[書誌情報をダウンロード]するとAmazon.co.jpからこれらをキーにした書影や書籍情報が自動入力される。ソートキーが合わないと出ないので、Amazonでの表記に気を付けて入力すること。

③　好きな電子書籍フォーマット（ここではEPUB）に変換する

書誌情報が揃ったらいよいよ変換。右クリックで[本を変換]→[個別に変換]を選択。

まずは右上の[出力フォーマット]で[EPUB]を選択する

あとは[EPUB出力]タブにした後[OK]でEPUBへの変換がすぐに完了する。

EPUBフォーマットに書籍ができていることがわかる。

④　完成したEPUBを読むには……

calibreにはEPUBリーダーが内蔵されているので、そのままダブルクリックでもいいのだが、逆にエクスプローラへのドラッグ＆ドロップで任意の位置に出力することができる。

出力したEPUBファイルはローマ字になっているので、日本語に直してから（直さなくていいけど）好きなデバイスに移して好きなEPUBリーダーで読むことができる。

個人的なお勧めはAndroidタブレットに移してCopperReaderというEPUBリーダーを使うこと。これは縦読みが可能なうえに段組みができるので文庫だったはずのエロラノベをノベルズのように読むことができたりしてなかなか新鮮な体験ができる。

以上が私の長いエロラノベ自炊の記録である。正直フラットヘッドでは辛いものがあるが、前述の通り挿絵のないエロ小説などは非破壊でスキャンができる可能性が高まる。
私も次回からはADFの用意されたスキャナを購入してから臨みたいのだが、やはり予算と校正（画像だけなら不要なんだが……）の問題が……

私だけのケースであり、実はいろんなところで設定に微調整を加えているはずなのだが、執筆に当たってはすっかり忘れてしまった。もしかするとこの手順のままでは詰まるかもしれない（滅殺）　よっぽど致命的ならFAQ追記も考えるので質問等も受け付けたい。

■

2012年9月12日水曜日

なんか嫌いなサイトを地獄に送るアドオンが流行っているらしいけど……

アドオンよりは……

@namespace url(http://www.w3.org/1999/xhtml);

@-moz-document domain("えふすく.com")  {
body *{display:none}

}

ってStylishで作っちゃったほうがよくない？

@namespace url(http://www.w3.org/1999/xhtml);

/*ドメイン1つ目*/
@-moz-document domain("えふすく.com")  {
body *{display:none !important}

}
/*ドメイン2つ目*/
@-moz-document domain("えふすく2.com")  {
body *{display:none !important}

}
/*twitterの場合*/
@-moz-document url-prefix(https://twitter.com/FSQUARE){ 
body *{display:none !important}
}

こんなふうに2つ以上のサイトやTwitterにも対応できるよ。
短縮でも開いた先がこれなら発動するはず。

そしてこれは見た目真っ白だから、むしろ天国送りだねｗ

【追記】body *{display:none !important}　がベストかな？

【追記】Chromeにもスタイルシート上書き拡張あったと思うけど全体に効くかなぁ？







■ツイート

Amazonマケプレの出荷通知の入力が楽になった件

今までは発送会社に発送サービス、そしてトラッキング（伝票）ナンバーを入力しなければならなかったんだけど、今日の出荷を入力しようとしたら……

デフォルト設定で2回目以降はトラッキングナンバーだけの入力で済むようになりました。
たまに荷物の大きさ的に別のサービスを使うときは、右上の「出荷情報の編集」で再入力が可能になる模様。これは次回の発注を受けた時に試してみようと思う。

■

2012年9月11日火曜日

エロラノベの自炊をしてみた記録その２

エロラノベの自炊をしてみた記録　その１
http://ccf-squarelab.blogspot.jp/2012/09/blog-post.html
の続きです

いよいよEPUB作り……の前に原料であるHTMLを作る

前回の作業で、エロラノベ1冊を文章部分と画像部分に分類したわけだが、当然のことながら電子書籍ではこれらを1つに統合しなくてはならない。
文章と画像を同時に扱えて、エディタで組めるソース的なものと言えば……HTMLということで、今回はHTMLを採用してみることにした。

エディタはMery＋プラグイン:テンプレートを使用している。

①　まずはHTMLの基礎を作る

Meryの[ツール]→[プラグイン]→[テンプレート]を選択した後、[HTML]→[基本ページ]を選択することで以下のHTMLひな形が完成する。

<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd">
<html xmlns="http://www.w3.org/1999/xhtml">
<head>
<meta http-equiv="Content-Type" content="text/html; charset=UTF-8" />
<title>お嬢様がお買い上げ　振り袖彼女はご主人様で恋のドレイ</title>
</head>

<body>
</body>
</html>

titleタグ内はこれから作成する電子書籍のタイトルでも入れておく。あと文字コードはUTF-8が望ましい。ここで変更するより、テンプレートの方で修正しておきたい。
実際のソースはbodyタグ内に書くことになる。

②　目次を作る

OCR作業で最初のページを作った際、目次をテキスト化したものを作ったはずなので、ここをリスト化して各章を本文のそれぞれの位置に内部リンクさせておく。
リンク先についてはこの後の本文の追加の時に記述する。

目次の例

プロローグ　幼なじみと再会？　……7
第一章　1億円でヤクサお嬢様に買われて　……14
第二章　お嬢様をイカせるのが執事の仕事　……63
第三章　いっときの逆転、ふたりの関係　……100
第四章　彼女は主人、彼女はドレイ……　……152
第五章　対等な恋人として、お尻H（はーと）　……201
エンディング　手と手をつないで　……253

<ul>
<li><a href="#0000">プロローグ　幼なじみと再会？</a>　……7
<li><a href="#0001">第一章　1億円でヤクサお嬢様に買われて</a>　……14
<li><a href="#0002">第二章　お嬢様をイカせるのが執事の仕事</a>　……63
<li><a href="#0003">第三章　いっときの逆転、ふたりの関係</a>　……100
<li><a href="#0004">第四章　彼女は主人、彼女はドレイ……</a>　……152
<li><a href="#0005">第五章　対等な恋人として、お尻H（はーと）</a>　……201
<li><a href="#0006">エンディング　手と手をつないで</a>　……253
</ul>

これをさっきのHTMLのbodyタグ内の最初の項目として挿入する。

③　画像・文章を挿入する

画像を挿入する場合、前後には文章があるはずなのでそれらは別にdivまたはpで括っておく。例えば画像0020.jpgを挿入する場合、前後には0010.txtと0020.txtを用意したので

<p>（0010.txt全文）</p>
<img src="0020.jpg">
<p>（0020.txt全文）</p>

という形になる。テキストファイルをHTML文書にそのままコピペすると改行がなくなるが、これは後で処理するのでここではこれを繰り返して全文をまとめたHTML作りを優先する。

④　各章のリンク先を設定する

①で作った目次のリンクで各章に本当に飛べるようにマーカーを設定する。
第１章の場合、文章中の章題部分を見つけて、<a name="0001">を設定すればよい。
見栄え上、章題は<h1>か<h2>を使って③の画像のようにすべきだと思う。

（略）　川本光一が尾崎紫苑と個人的な話ができたのは、それから二ケ月近くあとの七月のはじめ。梅雨がようやくあがった頃、紫苑邸でのことだった。</p>
<h1><a name=”0001”></a>第一章　１億円でヤクサお嬢様に買われて</h1>
<p>　その男が訪ねてきたとき、川本光一は、リビングのテレビに向かってゲームをプレイしていた。（略）

⑤　結合が終わったら順番が正しいかどうかチェック

こういうときにも校正の漏れがわかるので適宜修正する。
章リンクもチェックチェック。

⑥　改行を一括置換する

私がMeryで使っているのは、

　1回目　\n（改行コード）　→　<br>\n
　2回目　><br>　→　>

2回目はすでにタグのある行に対して改行を行わないためである。

⑦　HTML完成チェック

やはりきちんとできているかチェックする。小説であればあまりないのだが、新書だと太字や斜体、文字色などの指定もあると思うのでその辺はここで指定する。

以上で文章と画像を結合したHTML文書が完成。
次はツール（calibre-portable）を使った、電子書籍方式への変換を行う。

ここまでできたの図

エロラノベの自炊をしてみた記録その３【完結編？】
http://ccf-squarelab.blogspot.jp/2012/09/blog-post_13.html
に続く

■

登録: 投稿 (Atom)

ラベル

2012年9月26日水曜日

2012年9月22日土曜日

Firefox 16 Beta 4

Firefox 16 Beta 3

Firefox 16 Beta

結論：うーん、キャッシュ力が効いてる可能性大かも

2012年9月18日火曜日

インストールの流れ

gImageReader（deb/exe）を取得する 【共通】

Resseract-ocr-setup.exe、jpn.traineddataを取得する 【Windowsのみ】

Resseract-ocr-jpnをインストール 【Ubuntuのみ】

GimageReader.debをインストール 【Ubuntuのみ】

Resseract-ocr-setup.exeをインストールする【Windowsのみ】

jpn.traineddataをセットする 【Windowsのみ】

GimageReader.exeをインストール 【Windwosのみ】

日本語読取用設定を行う 【共通】

Firefox 16 Beta 3

Firefox 16 Beta

結論：Firefoxだと振れ幅が激しいベンチですね

2012年9月17日月曜日

実はWindowsでなくても自炊はできる！

問題はOCRだー！

ではOCR対象を発表しよう！

読んdeココ Ver.13

読取革命Lite 1.2.00

gImageReader＋resseract-ocr-jpn（Ubuntu）

gImageReader＋resseract-ocr-jpn（Windows）

2012年9月13日木曜日

① まず、問題のHTMLをドラッグ＆ドロップでcalibreに登録する

② 書籍情報を編集する

③ 好きな電子書籍フォーマット（ここではEPUB）に変換する

④ 完成したEPUBを読むには……

2012年9月12日水曜日

2012年9月11日火曜日

① まずはHTMLの基礎を作る

② 目次を作る

③ 画像・文章を挿入する

④ 各章のリンク先を設定する

⑤ 結合が終わったら順番が正しいかどうかチェック

⑥ 改行を一括置換する

⑦ HTML完成チェック

gImageReader（deb/exe）を取得する　【共通】

Resseract-ocr-setup.exe、jpn.traineddataを取得する　【Windowsのみ】

Resseract-ocr-jpnをインストール　【Ubuntuのみ】

GimageReader.debをインストール　【Ubuntuのみ】

jpn.traineddataをセットする　【Windowsのみ】

GimageReader.exeをインストール　【Windwosのみ】

日本語読取用設定を行う　【共通】

読んdeココ　Ver.13

①　まず、問題のHTMLをドラッグ＆ドロップでcalibreに登録する

②　書籍情報を編集する

③　好きな電子書籍フォーマット（ここではEPUB）に変換する

④　完成したEPUBを読むには……

①　まずはHTMLの基礎を作る

②　目次を作る

③　画像・文章を挿入する

④　各章のリンク先を設定する

⑤　結合が終わったら順番が正しいかどうかチェック

⑥　改行を一括置換する

⑦　HTML完成チェック