page 0 - << : 0 : >>
* やっつけspam対策
#掲示板spam対策
- メール欄(当サイトではurl欄に転用だが、nameは'mail'のまま)に「@」があったら、それはspam
- 本文に「''<a''」や「''[url''」があったら、(ry
if ($FORM{'mail'} =~ /@/) { $is_spam = 1 ; } if ( ($FORM{'data'} =~ /<a/) or ($FORM{'data'}=~ /\[url/)) { $is_spam = 1 ; }
* HTMLをXHTMLに変換してREXMLで処理
プログラム(抜粋)
#Web #ヤフオク
h = Html2xhtml.new h.read_array(readlines) require "rexml/document" y = REXML::Document.new(h.body.to_s) y.elements["/html/body"].elements[6, 'table'].elements['tr/td'].elements.each('a') do |a| p a.attributes['href'] print a.text.strip + "\n" end結果
"http://auctions.yahoo.co.jp/jp/0-category.html?" オークション "http://list3.auctions.yahoo.co.jp/jp/23336-category.html?" コンピュータ "http://list3.auctions.yahoo.co.jp/jp/2084039759-category.html?" パーソナルコンピュータ楽だ…めっちゃ楽だ…
#Web #ヤフオク