エロページ2001.09.01
動画曜日 http://www.rr.iij4u.or.jp/~tontom/mday/main.html
動画生活 http://www.rr.iij4u.or.jp/~tontom/mlife/main.html
動画市場 http://www.rr.iij4u.or.jp/~tontom/mmarket/main.html
動画臓器 http://www.hh.iij4u.or.jp/~tontom2/morgans/main.html
アニメガバイト http://www.hh.iij4u.or.jp/~tontom2/animb/main.html
のエロ動画を簡単に落とす為に作成。
上に書いたページは、1つのエロ動画につき、ひとつのページに URL が書いてあって、しかもその URL は全角文字も混じっている。
そこで、ページの中の URL 部分のみを抜き出して、全角文字を 半角ローマ字に変換する scrpit。
使いかたは、Browser で、URL の書いてあるページを全部落とした後に、
そのディレクトリに入って、
$ z2h-grep *.html > t.txt
usage:
$ z2h-grep *.html > t.txt
$ wget -b -i t.txt && beep-beep &
require 'kconv' # toeuc を使うのに必要 require 'jcode' # 日本語を扱うのに必要 $KCODE = 'euc' # 日本語モードを euc に決め打ち。 while gets line = Kconv::toeuc $_ # 読み込んだ一行を euc に変換して、line に入れる。 if /http/ =~ line # line に http の文字が含まれていたら、以下を実行。 print line.sub("<\/FONT>", '' ).sub("\<FONT COLOR\=\"\#FF0000\"\>",'').tr("a-y0-9", "a-y0-9") end end上のメインの部分は、別けると、sub("<\/FONT>",'') </FONT> を、ブランク('') に置換 sub("\<FONT COLOR\=\"\#FF0000\"\>",'') <FONT COL〜 を、ブランク('') に置換 tr("a-y0-9", "a-y0-9") 全角文字を半角に変換。に、なる。
sub の部分は、ホントは、tr, delete で、変換なり、カットなりをしたかったけど、
URl の中にあるその他の部分で、一文字マッチしたとこも置換、カットしてしまうので、まずい。
sub は該当する一ヶ所のみ置換してくれるので、苦肉の策。
最近、ホームページにインストール記録とか、メモとか、いろいろアップする様にしているので、 HTML を書く機会が増えている。2001.09.01
でも基本が vi な人間なので、いちいち改行タグ <br> を入れるのがめんどくさい。
bluefile のショートカットキーの設定に shift + enter で <br> を入れているけど、それでもかなり面倒臭い。
Netscape Composer を使えばよいのでは? とも考えたけど HTML を勉強中の今日この頃、ソースを見る機会が多いが、Composer の作る HTML file は解読するのが取っても大変。
ましてや、それが他人の書いたものなら、その苦労たるや、「もーイヤッ」ってくらいの労力を費すことになる。だって、初心者なんだもん。イチイチ本とソースを見比べながらなんだもん。
だからせめて自分のソースぐらいは(自分が)見やすくしたい。
前置がかなり長くなったが、要はさらのテキストファイルの文末に 問答無用 で改行タグ
<br>
を入れる小物を作ったって事。
使いかたは
$ add-br sarano-text > br-irino-text
これで
> 2001.09.01
> ~/bin/add-br.rb
>
> 最近、ホームページにインストール記録とか、
> HTML を書く機会が増えている。
> でも基本が vi な人間なので、
> いちいち改行タグ <br> を入れるのがめんどくさい。
> bluefile のショートカットキーの設定に
という文章が、
> 2001.09.01 <br>
> ~/bin/add-br.rb <br>
>
> 最近、ホームページにインストール記録とか、 <br>
> HTML を書く機会が増えている。 <br>
> でも基本が vi な人間なので、 <br>
> いちいち改行タグ <br> を入れるのがめんどくさい。 <br>
> bluefile のショートカットキーの設定に <br>
ってぐあいになるのじゃ。
空白行には入れないってトコがにくいね。
でも、逆をかえせば空白行以外は <title> だろうが、<body> だろうが、
何でもかんでも <br> を入れてしまう。。。
しょせんオレの ruby 度はこんなもんよ。
い−よ、コピ−+ぺ−ストするからさ。
最近は bluefish だけどその前は netscape composer を使ってインスト−ル記録とか付けていた。2001.07.04
で、bluefish に乗り換えてから思ったのが、 composer の吐くテキストがすっげ−見にくい事。
まじで解読するのに時間がかかる。
ま、それは置いといて、ガマンならないのが文頭に <br> や、<tt> が来ること。
(個人的に固定ピッチが好みなので使っていたら、)
(<tt> を各行に律儀に入れてくれていた)
見ていてイライラする。これは個人の感性の問題なんだけど、個人の問題だからこそ自分で何とかする事にした。
といっても composer をどうにかするなんてこと出来ないし、する気もない。
当分は composer を使うつもりはないので、吐いたテキストをどうにかする事にした。
また前置が長くなったが、
行頭の <br> <tt> または、<p> <tt> と、行末の </tt> を削除して、
行末に <br> を追加
する小物を作った。
使いかたは
$ net2blu.rb comoser-file > bluefish-file
これで、
> <br><tt> ここには ruby について書く事にする。 </tt>
> <br><tt> どうでもいいけどcannaの漢字変換は </tt>
> <br><tt> 何とかならないのだろうか。 </tt>
> <br><tt> おばかでしょうがない。 </tt>
ってな感じの composer ファイルが、
> ここには ruby について書く事にする。<br>
> どうでもいいけどcannaの漢字変換は<br>
> 何とかならないのだろうか。<br>
> おばかでしょうがない。<br>
と、なる。
固定ピッチの <tt> </tt> は文章全体を括れば効果があるので
変換後に手で入れれば O.K.
コマンド名の由来は NETscape TO BLUefish と、かなり安直。
最近、市販の音楽CDを買うとコンポに入れずにPCに入れるようになってきた。
そんな時にめんどくさいのが、曲名リスト。
mp3 ファイルのファイルネームを変えるのもめんどくさいので
audio.list を作って、その中に曲名を、
1:hogehoge
2:hagehage
3:...
ってな具合に書いている。
が、この 1: 2: をいちいち手で入れるのが、まためんどくさい。
ってことで、1 から 10 までの数字を表示する小物を作った。
といっても、for ル−プを 1 から 10 までただ回しているだけ。
な−んのひねりもありゃしない。
われながら、ショ−モナイもんつくったな。
$ ruby 1-10.rb > audio.list
ってな具合に作って、
$ vi audio.list で
曲名をイチイチ手で入れる事になる。
bash-script でも書いたからそっちもあるよ。