2010年06月01日(火)<< 前の日記 | 次の日記 >>
この日の詳細

■1Hyper Estraierを導入[hns] このエントリーをはてなブックマークに追加

これまで、日記の全文検索には、namazu for hnsを使っていたのだけれども、特にカタカナ語で検索からの漏れが発生するのと、Tweetも検索の対象に入れたいと言うのがあって、検索システムの入れ替えを模索していた。
最近は、全文検索システムも色々ある様なのだけど、フィルタや中間ファイルによるカスタマイズができると言う点で、 Hyper Estraier[http://hyperestraier.sourceforge.net/] を選択した。
既に、関連文書検索用にhnfからplainテキストを生成する仕組みがあるので、この後にインデクサを走らせることにした。Tweetについては、draft形式を生成する簡単なフィルタを書いて、登録。
検索漏れも無く、日記とTweetの両方を検索できるようになって、ずいぶん便利になった。

■ 関連記事

詳細はこの日の詳細から

2010年06月04日(金)<< 前の日記 | 次の日記 >>
この日の詳細

■1 HTC DesireをGet[http://www.htc.com/www/product/desire/overview.html][携帯端末][Android][desire] このエントリーをはてなブックマークに追加

世の中、iPadとかで盛り上がっている今日この頃なのだけど、その陰で、携帯端末としてのAndroidが密かに熱い。
SoftBankから発売されたAndroid端末、HTC Desire(X06HT)の到着を熱く待ちわびる人達のTweetを、 #x06ht[http://twitter.com/#search?q=%23x06ht] で追うことができるが、とにかく品薄で入手が困難らしい。
国内でAndroid携帯が普及する様だったら、ゲットしようと決めていたので、いささか慌てて手配した。
HTC Desire
カスタマイズはおいおい。

■ 関連記事

詳細はこの日の詳細から

2010年06月05日()<< 前の日記 | 次の日記 >>
この日の詳細

■1HTC Desireの環境設定[携帯端末][android][desire] このエントリーをはてなブックマークに追加

今日あたり、SoftBankの X06HT[http://mb.softbank.jp/mb/product/X/09wi/#x06ht] も届き始めた様で、TLを見ていても各地で喜びの声が上がっている様だ。
ということで、乗り遅れない内に色々とカスタマイズを。

Android Debug Bridge向けの設定:

まずは、adb(Android Debug Bridge)から見えるようにしないと何もできないので、USBデバッグをONにして、USBケーブルで接続。デバイスドライバのインストール画面が出てくるので、導入済みの SDK[http://developer.android.com/sdk/index.html] のディレクトリの中のusb_driverを指定してインストール。
ドライバファイル指定
「このハードウェアをインストールできません」と言われるので、infファイルを確認すると、対応機種になっていない様なので、 USBDevview[http://www.nirsoft.net/utils/usb_devices_view.html] で調べてやって、既存のエントリーを真似て、
android_winusb.inf
[Google.NTx86]
; HTC Dream
%SingleAdbInterface%        = USB_Install, USB\VID_0BB4&PID_0C01
%CompositeAdbInterface%     = USB_Install, USB\VID_0BB4&PID_0C02&MI_01
%SingleBootLoaderInterface% = USB_Install, USB\VID_0BB4&PID_0FFF

(中略)

; HTC Desire
%SingleAdbInterface%        = USB_Install, USB\VID_0BB4&PID_0C87
%CompositeAdbInterface%     = USB_Install, USB\VID_0BB4&PID_0C87&MI_01
とかいう感じに追加して、再度トライ。
Android Composite ADB Interface Installed
PC側を再起動して、DDMS(Dalvik Debug Monitor Server)を起動すると、端末が認識された。
DDMS
画面キャプチャも取れるようになった。
画面キャプチャ

b-mobileのUSIMを使う:

購入したDesireは、SIMフリーなので、キャリアの選択の幅が広い。そもそもSIMカード無しでも使えるので、最初は モバイルWiFiルーター を使って接続すれば、ノートPCも使えて便利だと思ったのだけれど、iPadならまだしも、ポケットから出せばすぐに使えるのが身上なのに、別に機器を持ち歩いたりするのは残念なのでSIMを入れることにした。
ということで、あとくされのないb-mobileの使い放題パッケージを購入。 b-mobile SIM
FOMAのSIMカードが入っているので、折り取って挿入。パッケージに書いてある内容に従って、開通手続きの電話をして、APN情報を設定してセットアップ完了。
300kbpsでどの程度使えるかなと心配はしていたけれども、メールやTwitterには十分の様だ。どこでもつながる便利さを考えれば、これで十分な様な気がする。
制限付きサービス
アンテナの表示が出ないのと、起動時に「制限付きサービス」という画面が出る課題は、 Froyo[http://developer.android.com/sdk/android-2.2.html] で解決されることを期待して、とりあえずは放置して使うことにした。

■ 関連記事

詳細はこの日の詳細から

2010年06月06日()<< 前の日記 | 次の日記 >>
この日の詳細

■1Desireの保護ケースと保護シール[携帯端末][android][desire]次の記事 >> このエントリーをはてなブックマークに追加

日常携帯して使うものなので、それなりに傷が付いたりするのは仕方がないけれども、ケースに入れておいた方が、気を使わなくて済むのでケースに入れた。 この商品には、液晶表面の保護シートが付属しているけれど、艶消しの方が好みなので、保護シートも別に購入。 用意したのは、保護フィルム、ガーゼ、ピンセット、レンズ用のほこりを払う刷毛、カメラ用のブロア、エタノールと水を混ぜたクリーナー等。
とにかくほこりを入れ込まないことが肝心なので、作業スペースの周囲を掃除してブロアで吹いて、ほこりが落ち着いたところで、手を洗って脂を落として、髪の毛をタオルで束ねてほこりを落とさないようにして、作業開始。
このあたり、 寒天培地[http://ja.wikipedia.org/wiki/%E5%AF%92%E5%A4%A9%E5%9F%B9%E5%9C%B0] を使った、実験操作の心得を調べておくと、色々なヒントが得られるかも知れない。
保護フィルムとガーゼ
ガーゼは一旦あらって乾かしておくと、ほこりが取れて繊維も柔らかくなって扱いやすい。
液晶画面をエタノール水に浸して絞ったガーゼで拭いて、汚れを取り除く。なお、液晶表面をエタノールで拭くのは確実に安全かどうかは分からない。心配であれば水だけで拭きあげた方が良いかも知れない。
刷毛とブロアで残ったほこりを払い、紙をかぶせてほこりがかぶらないようにしておく。
拭きあげてほこりを取り除く
ちなみに、真横に近い方向から電気スタンド等の光源で明るく照らしてやると、残ったほこりを見つけやすい。
保護シートに持ち手を付ける
あらかじめ、保護シートにセロハンテープで持ち手を付けておく。
裏面のシールを剥いだ後に、ほこりを吸い寄せてしまうと残念なことになるので、本体のほこりをブロアで吹いて、落ち着いたところで、本体の上、なるべく近いところで裏面のシールを剥いで、すぐに位置決めして貼り付けて行くようにする。 この時に、持ち手を付けておくと扱いやすい。
貼り合わせ方は、上の端から左右中心を下になぞっていき、縦の中心から左右に広げる感じで貼り合わせていけば、空気が入りにくい様だ。
完成したところ
ジャケットは黒を選んでみた。手にはジャケット無しよりもしっくりなじむ感じ。

■ 関連記事

■2root化する[携帯端末][android][desire]<< 前の記事 | 次の記事 >> このエントリーをはてなブックマークに追加

root取得しておかないとできないカスタマイズも多そうなので、先にroot化しておく。
まずは、 How to create a GoldCard[http://android.modaco.com/content/general-discussion/305672/creating-a-goldcard/] や、邦訳の Goldcardの作り方[http://qtotter.wordpress.com/2010/06/04/goldcard%E3%81%AE%E4%BD%9C%E3%82%8A%E6%96%B9/] を参考に、Goldcardなるものを作る。
Goldcardとは、要は特殊な設定をしたmicrosSDカードで、このカードを使うと、ブートローダーに署名されていないカーネルを送り込むことができるということらしい。
microSDカード、Android SDK、バイナリエディタの HxD[http://www.off-soft.net/ja/software/develop2/hxd.html] を用意する。
まずは、microSDカードをWindows上で、FAT32でフォーマットし、Desireに挿入。Desireを起動して、PCと接続し、コマンドプロンプトで、Android SDKのToolsディレクトリから、以下の様に実行。
Microsoft Windows XP [Version 5.1.2600]
(C) Copyright 1985-2001 Microsoft Corp.

C:\Documents and Settings\kei>cd C:\application\android_sdk\tools

C:\application\android_sdk\tools>adb shell cat /sys/class/mmc_host/mmc1/mmc1:*/c
id
* daemon not running. starting it now *
* daemon started successfully *
XXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXX

C:\application\android_sdk\tools>
「XXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXX」の部分は、実際には、各々異なる、32文字の16進文字列となるはずだ。
この値を、 Soaa-'s lame GoldCard hex reverse page[http://hexrev.soaa.me/] のフォームに入力して、転置されたやはり32文字の16進数文字列を得る。
Yer done!
00cdab8967452301efcdab8967452301
Enjoy! Now go here to get your GoldCard image. Bye now!
といった感じだ。
この16進数文字列を、 Free HTC android goldcard generator[http://psas.revskills.de/?q=goldcard] のフォームに入れてやると、そのカードに対応するGoldcardのイメージファイルが、「goldcard.img」として添付されて、メールで送られてくるので、保存しておく。
HxD[http://www.off-soft.net/ja/software/develop2/hxd.html] を起動し、物理ディスクとしてリムーバブルディスク(DesireのUSBドライブ)を開く。
ディスク選択
この時、「読み取り専用として開く」チェックボックスを外しておくこと。
念のため、サイズを確認しておくと良いだろう。
サイズの確認
2GBのSDカードを使っているので、違うものを見ていることはなさそうだ。
メールで送られてきた、goldcard.imgを先頭に上書きコピーする。先頭からOffset 00000170の行までを選択してコピーし、リムーバブルディスク側も同様に、先頭からOffset 00000170の行までを選択して、書き込みの貼り付けを実行する。
上書きコピーコピー後
後は、保存して終了すれば、Goldcard完成。

Root化:

Goldcardができたので、いよいよroot化する。
HTC Desire rooting guide[http://android.modaco.com/content/htc-desire-desire-modaco-com/307365/24-may-r5-htc-desire-rooting-guide-now-with-hboot-0-80-and-os-to-1-21-support/] と、邦訳 HTC Desireのroot化の手順[http://qtotter.wordpress.com/2010/06/04/htc-desire%E3%81%AEroot%E5%8C%96%E3%81%AE%E6%89%8B%E9%A0%86/] を参考に。両者を熟読して、手順と内容をしてから作業に着手した。
step1consolecomplete
step1-windows.batの実行後に、USBドライバのインストールが途中に入った関係で、USBケーブルを抜き差ししないと先に進まなくなってハラハラした位で、後は手順通りに実行して、root化できたようだ。
自己責任の世界へようこそ!

■ 関連記事

■3日本語フォントの差し替え<< 前の記事 このエントリーをはてなブックマークに追加

Desireのフォントだが、CJKを同じ文字で賄ったのか、日本語なのだけども、どこか中華風の味付けになっているのが気になる。
フォント比較
「言語」の「言」の上や、「設定」の「言ベン」の上が点になっているのが、この画面での特徴的な違いだが、「大阪」の「阪」等にも違和感を感じる。
ということで、著作権上問題の無さそうな *1 日本語フォントを持ってきて導入することにする。
android_sdkには、DroidSansJapanese.ttfというファイルが同梱されているので、このファイルを使用する。
ボリュームダウンボタンを押しながら電源を入れ、リカバリーモードに入れて、Root化した時の要領で、recovery-windows.batを実行しておく。
Desire側には、リカバリーコンソールが表示されるので、コマンドプロンプトを開いて、 adb shellで、systemをmountしておいて、adb pushで/system/font以下に送り込んでやれば完成。
この方法を使えば、/system以下を書き換えることができるので、カスタマイズも容易だ。
*1: 確実にシロと確認できている訳では無いけども、メイリオなんかをWindowsから持ってきたりすると明らかにクロだろうから、そういうのは避けることにした。

■ 関連記事

詳細はこの日の詳細から

2010年06月07日(月)<< 前の日記 | 次の日記 >>
この日の詳細

■1テザリングでノートPCももっと便利に[携帯端末][android][desire] このエントリーをはてなブックマークに追加

今日のメニュー画面
Desireを手に入れる前のモバイル運用は、 au[http://www.au.kddi.com/] のEXLIM携帯 W53CA[http://k-tai.casio.jp/products/w53ca/] と、Let's note CF-R4。CF-R4のネット接続には、Wi-Fiと W05K[http://www31.atwiki.jp/w05k/] を使用する形態だった。
当然、モバイル専用で無いページを開こうと思うと、 W53CA[http://k-tai.casio.jp/products/w53ca/] ではずいぶん苦しいものがあるから、そういう時はCF-R4を取りだして、 W05K[http://www31.atwiki.jp/w05k/] 経由で接続することになる。
これからは、Desireを導入したのでDesireだけでできることが多くなって、CF-R4を取りだして「店開き」をする機会は減るだろうし、USB経由でファイルの受け渡しをすれば、直接、ネット接続ができなくとも何とかなることは多いはずだが、PCをネットに接続する、いわば命綱としての接続手段は用意しておきたいと思った。
そこで、 テザリング[http://ja.wikipedia.org/wiki/%E3%83%86%E3%82%B6%E3%83%AA%E3%83%B3%E3%82%B0] なのだけれども、これは、Desireを外付けモデム(ネットワークアダプターに見える)の様に使って、Desireのモバイル回線を使って、PCをネットに接続する…という技だ。
電源を確保できるような喫茶店で、落ち着いて店開きした時に、DesireをノートPC経由で充電している間に、PCからDesireの回線を使ってネット接続ができるわけです。これは便利そうです。
無線とネットワーク接続タイプを選択
設定は、「無線とネットワーク」から「インターネット共有」にチェック。PCに接続の「接続タイプを選択」で、「インターネット共有」を選ぶ。
HTC Remote NDIS based Device
PC側では、ネットワーク接続に、「Remote NDIS based Device」というデバイスが現れて、このデバイス経由でネット接続できるようになる。
速度感は、これまでのW05Kに比べれば明らかに遅いけども、 WILLCOMのつなぎ放題[http://www.willcom-inc.com/ja/plan/data/whole/index.html] を使っていた頃に比べれば、安定して早いと言った感じだ。これまでの使い方を考えると、大きいサイズのファイルをやり取りする必要がある場合は、Wi-Fi接続を確保していた訳で、恐らくこの速度があれば命綱としては十分だろう。エリアの広さも安心だ。
ちなみに、ネットワークに、pingやtracerouteが通らないと言った、若干の癖はある様だけれども、少なくともWebとsshの利用には支障は無かった。

■ 関連記事

詳細はこの日の詳細から

2010年06月08日(火)<< 前の日記 | 次の日記 >>
この日の詳細

■1さるくガイドPDF版[電子書籍][desire] このエントリーをはてなブックマークに追加

最近、龍馬ブームで観光客が増えている長崎だけれども、長崎が行っている感心な提案に さるく[http://www.saruku.info/index.php] がある。
さるくは長崎弁で「あるきまわる」と言った様な意味で、長崎のまちをより楽しむために、歩き回りましょうと言った様な提案で、コースガイドパンフレットが用意され、またボランティアのガイドもあり、長崎をより楽しめるようになっている。 まさに、観光地のソフトウェアによる魅力アップである。
さて、このさるくガイドだが、A4見開き4ページの構成で、コースごとにコースマップが作られており、感心なことに ダウンロード[http://www.saruku.info/coursemap.html] できるようになっている。
これをDesireに入れておけば、ちょっと時間が空いた時に、長崎探索ができてすばらしい。 ただし、元が印刷向けの高品位なPDFファイルなため、そのままでは扱いが辛いかも知れない。

■ 関連記事

詳細はこの日の詳細から

2010年06月09日(水)<< 前の日記 | 次の日記 >>
この日の詳細

■1携帯版さるくコースガイド[電子書籍][desire] このエントリーをはてなブックマークに追加

Desireで表示したコースガイド
昨日作った[http://www.nantoka.com/~kei/diary/?20100608S1] 、さるくコースガイドをまとめたPDFだけれども、携帯端末で見るにはあまりにも大きいので、 ImageMagick[http://www.imagemagick.org/script/index.php] を駆使して、keitai_saruku.pdfとかいうものを作ってみた。
いったん、各ページをPNG画像に変換して、PDFにしてあるので、携帯端末で見る時も動作が軽い様だ。
せっかく作ったのに配布できないのは残念で、正式に携帯端末用が配布されることを願うしかないのだけど、とりあえずは役に立ちそうだ。

■ 関連記事

詳細はこの日の詳細から

2010年06月16日(水)<< 前の日記 | 次の日記 >>
この日の詳細

■1 「セキュア・ジャパン2010(仮称)」(案)に関する意見の募集[http://www.nisc.go.jp/active/kihon/sj2010.html][セキュリティ][政策] このエントリーをはてなブックマークに追加

パブコメ募集。28日締切。

■ 関連記事

詳細はこの日の詳細から

2010年06月17日(木)<< 前の日記 | 次の日記 >>
この日の詳細

■1 正義の味方と悪玉の特徴〜勝手に今日輝いていたレス大賞 157[http://society6.2ch.net/test/read.cgi/gline/1275614437/88][ネタ] このエントリーをはてなブックマークに追加

「ソースは2ちゃんねる」というヤツですが、確かに考えさせられました。公開の経緯から見て、転載できると判断して転載させて頂きます。
正義の味方の特徴
1 自分自身の具体的な目標をもたない
2 相手の夢を阻止するのが生きがい
3 単独〜小人数で行動
4 常になにかが起こってから行動
5 受け身の姿勢
6 いつも怒っている

悪玉の特徴
1 大きな夢、野望を抱いている
2 目標達成のため、研究開発を怠らない
3 日々努力を重ね、夢に向かって手を尽している
4 失敗してもへこたれない
5 組織で行動する
6 よく笑う

■ 関連記事

詳細はこの日の詳細から

2010年06月19日()<< 前の日記 | 次の日記 >>
この日の詳細

■1 Webサービスの開発者は、「多くの利用者は、どのサービスにもおんなじパスワードを使ってる。」って覚悟をもってなきゃいけないと思う。[http://twitter.com/keikuma/status/14822885070][セキュリティ] このエントリーをはてなブックマークに追加

パスワードの使い回しは大きなリスク、偽の確認メールで聞き出す手口も[http://www.itmedia.co.jp/enterprise/articles/1006/17/news030.html] という記事を読んで、以前のTweetを蒸し返してみる。
同社が英国、ドイツ、スウェーデンで1500人のインターネット利用者を対象に実施した市場調査によると、回答者の約20%が同一のパスワードを使い回していた。パスワードをメモ用紙などに書き留めている回答者もほぼ同数に上り、8%はパスワードを忘れてしまうために毎回パスワードを設定し直していた。
同じパスワードを使いまわすと危険という警鐘は常に鳴らされているが、実際の所、同じパスワードを使いまわす利用者が相当数存在すると言うのは事実の様だ。
この記事では、パスワードをメモすることに否定的な様だが、 パスワードを、メモしないことと、使いまわさないことは、現実問題としてはトレードオフの関係にある と考える。
むしろ、 「パスワードはメモしておけ」−MSのセキュリティ担当幹部、自説を披露[http://www.nantoka.com/~kei/diary/?20050526S4] の記事で紹介した様に、安全なパスワードをメモして安全に保管する方が、少なくとも、同じパスワードを使いまわすよりは、脅威を与える相手によるけども *1 、安全なのではなかろうか。
「メモするな」というセキュリティポリシーは、社内で一つのパスワードを使用し、同僚から守らなければならない状況の下で有効なものであって、家庭でいくつものサービスを利用する状況の下で有効なものでは無い筈だ。
ちなみに、私自身は、マスターパスワードをセットした上でブラウザに覚えさせる。 TrueCrypt[http://www.truecrypt.org/] で暗号化したファイルにメモする。 特に大切なパスワードに関しては、前半分をランダムに生成してメモして、後半は共通のものを使いまわす。 という運用をしている。
前置きが長くなってしまったけれど、ここまでは、「同じパスワードを異なるサービスに使わない様にしよう」という、利用者向きの話題。
それでも、同じパスワードを使う利用者がいる事実があって、あるサイトが、生のパスワードを記録する作りにしていたとすると、ユーザ情報が漏えいした場合、利用者に対して、例えばパスワードのハッシュを保存していた場合と比較して、より大きい被害が出ることは間違いが無い。もちろん、単純なハッシュよりも、ソルトが付いたハッシュ、サービス独自の秘密のソルトを付けたハッシュとした方が、より影響が小さくなるかも知れない。
もう一歩進めれば、そもそもパスワードを管理させるから、使いまわすリスクが増える訳で、サービスによっては、OpenIDなり、OAuthなり、場合によってはブラウザに覚えさせたり、メールでリカバリするのを前提で、サービス側からデフォルトパスワードを発給した方が、利用者が利用している他のサービスに危険を及ぼさないという意味で安全なのかも知れない。
サイトの作り手としては、利用者のパスワードを受け取ることには、常に責任が伴うことを意識する必要があるだろう。
*1: 例えば、家族にSNSのアカウントを覗かれたくない場合は、手帳にパスワードをメモするのは危険かも知れない。

■ 関連記事

詳細はこの日の詳細から

2010年06月21日(月)<< 前の日記 | 次の日記 >>
この日の詳細

■1 続・robots.txtに従わず、図書館HPにアクセス3万3千回 業務妨害容疑で男逮捕[http://www.nantoka.com/~kei/diary/?20100526S2][セキュリティ][プライバシー] このエントリーをはてなブックマークに追加

容疑者とされた当人が、 Librahack[http://librahack.jp/] として、顛末を説明している。
想像通り、端的に言えば、図書館ページが提供するインターフェイスが使いにくいので、スクレイピングして、検索しやすいデータベースを用意しようとした。ということの様だ。
だとすると、 前の記事[http://www.nantoka.com/~kei/diary/?20100526S2] でも書いたけれども、こんなことで逮捕される様では、技術的な実験も研究も、全て、逮捕を覚悟して掛らなければならないということになる。結果、技術の進歩を著しく阻害する危険性がある。
こんなことが起これば、日本でGoogleの様な、あるいはGoogleを超えるサービスを開発しようとは思わなくなる。
実際、図書館の蔵書データベースを無償で提供している カーリル[http://calil.jp/] というサービスがあるが、この会社は拠点を米国に置いている。
この逮捕が、日本のネット技術の進歩を抑圧する目的で無かったのであれば、当局には、事情を説明する責任があるのではないか。
ところで、多くの図書館は、思想信条の自由を守り抜くため、 図書館の自由に関する宣言[http://www.jla.or.jp/ziyuu.htm] を掲げており、 これは 岡崎市立中央図書館[http://www.library.okazaki.aichi.jp/tosho/index.asp] も、 例外ではない[http://www.library.okazaki.aichi.jp/tosho/about/activity.html]
この宣言では、
第3 図書館は利用者の秘密を守る
1. 読者が何を読むかはその人のプライバシーに属することであり、図書館は、利用者の読書事実を外部に漏らさない。ただし、憲法第35条にもとづく令状を確認した場合は例外とする。
2. 図書館は、読書記録以外の図書館の利用事実に関しても、利用者のプライバシーを侵さない。
3. 利用者の読書事実、利用事実は、図書館が業務上知り得た秘密であって、図書館活動に従事するすべての人びとは、この秘密を守らなければならない。
ということを宣言している。つまり、正当な令状無しに利用者の利用事実の記録を外部に漏らすことは無いと言っている。「利用事実の記録」には、私は、Webサーバのアクセスログは含まれると考えるのだが、だとすると、今回の事件で、愛知県警は捜査令状を得た上で、ログファイルを押収したのだろうか。
だとすると、その中には、当然、他の利用者の検索履歴も含まれていたはずで、他の利用者に対して何の説明も行われないのはおかしいのではなかろうか。

岡崎市立図書館蔵書検索システムの謎:

岡崎市立図書館蔵書検索システムのページにアクセスしてみて、表示ができなくなったりすることを不思議に思って調べてみたのだが、このサイト、 ASPで生成しているページに関して、Cookieで多重アクセスを抑制しようとして何か謎な現象が起きている様に見える。
本件で問題になっている、 新着情報[http://www.library.okazaki.aichi.jp/tosho/Newbook/0200.asp] のページもASPページだし、 図書館のトップ[http://www.library.okazaki.aichi.jp/tosho/index.asp] も、 蔵書検索ページ[http://www.library.okazaki.aichi.jp/tosho/asp/kensaku_g.asp] も、ASPで生成されている。
なぜ、こう推察したかは、以下の様な観測に基づいている。
何らかの理由で *1 、検索ページや、新着情報ページ等が応答を返さなくなると、以下の様な症状が発生する。
トップページ
http://www.library.okazaki.aichi.jp/tosho/index.asp[http://www.library.okazaki.aichi.jp/tosho/index.asp] の様に、ASPで生成されるページが応答を返さなくなる。
しかしながら、この時、 http://www.library.okazaki.aichi.jp/tosho/[http://www.library.okazaki.aichi.jp/tosho/] の様なアクセスはエラー応答を返すし。
エラーページ
http://www.library.okazaki.aichi.jp/tosho/collection.html[http://www.library.okazaki.aichi.jp/tosho/collection.html] の様な、ASPを介在しないページは、正常にアクセスができる。
エラーページ
この状態に陥った時に、Cookieを削除してやると、正常にアクセスできるように回復する。
Cookie
つまり、Cookieを頼りに、ASPへの同時アクセスを制限しようとしている様なのだけれども、この時のパケットダンプを見ると、HTTP GETに対するACKを発行したまま、だんまりという状況になっている。
Wireshark
IISでのASPの実装経験が浅いので断言するのは難しいのだけれども、 GETをACKで受けたまま、ASPが安全に終了する様なコードを書くのはきっと難しいはずなので、これは内部的には、実装者が想定していないことが起きている可能性があるのではないかという想像もできる。
だとすると、実際には、このシステムは 500番台のHTTPエラーを出すことは無かったのではないか という疑いも生じるし *2こんなビザンチン障害を発するシステムの応答を見て、自分のせいかも知れないと判断するのは難しい のではなかろうか。
検索ページのソースにも
//2重実行防止
function jfSubmit() {
//alert(document.frmKensaku.hidKensakuF.value);
	if(document.frmKensaku.hidKensakuF.value == "0"){
		document.frmKensaku.hidKensakuF.value = "1";
		return true;
	}else{
		return true;
	}
}
という興味深いコードがある。
以下は上記の観測を基にした推察であるが、このサイトの実装者は、イントラネットで使われる業務システムの様に、サイト利用者はマニュアル通りにシステムを操作し、システム設計者の想定と異なるアクセス操作は行わないという前提でシステムを実装したのではないか。
しかも、制限の仕組みにバグがあって、Cookieの制限に従わない、例えばCookieを食わないブラウザや、スクリプトでアクセスすると、不具合が顕在化してしまう。
本来、インターネットというパブリックな環境においてアクセスされるのが前提であるシステムにおいて、当然想定すべきだった操作を、設計者あるいは実装者が想定していなかったからと言って、公権力の行使という形でユーザーに責任転嫁されるのはとんでもない話だと思う。
*1: 検索ページで、「1%」という書名を検索した際にたまたま発生した。理由は分からない。
*2: (7月22日追記)その後の情報で、 あるリクエストを境に[http://librahack.jp/okazaki-library-case/libra-server-accident.html] 連続してエラーが発生することが判明した。
新たな情報を基にしたメカニズムの推察については、 7月22日の記事[http://www.nantoka.com/~kei/diary/?20100722S1] を参照頂きたい。

この記事に頂いたコメント

Re: 続・robots.txtに従わず、図書館HPにアクセス3万3千回 業務妨害容疑で男逮捕 by Zliz    2010/06/21 23:26
like演算を使っていて"%"がワイルドカードになるらしいです。 それで検索に...

■ 関連記事

詳細はこの日の詳細から

2010年06月22日(火)<< 前の日記 | 次の日記 >>
この日の詳細

■1 岡崎市立中央図書館に電話してみた[http://www.nantoka.com/~kei/diary/?20100621S1] このエントリーをはてなブックマークに追加

この件、どうも良く分からないので、経緯について岡崎市立中央図書館に電話して、事情を訊いてみた。経緯は、以下の様な感じだ。
  1. サーバの不調について、管理会社に調査してもらった
  2. 管理会社の調査で、外部からの攻撃が判明
  3. 警察に被害届を提出
  4. 私(電話に出られた担当の方)が知る限り、警察からは2,3回、問合せがあった
  5. サーバの調査等は、私が知る限り行っていない
  6. 令状を持った捜査が行われたことは無い
  7. 逮捕は報道で知った
残念だったのは、図書館の運営に携わりながら、 図書館の自由に関する宣言[http://www.jla.or.jp/ziyuu.htm] をご存じで無かったということだけれども、一般の事務職員の認識はこの程度なのかも知れない。
いずれにせよ、上記の情報から判断すると、
  1. ログも分析しない様な、かなり杜撰な捜査で逮捕まで持って行った
  2. 管理会社と警察の間で、ログファイルの「任意」提出などが行われた
のいずれかが行われたのではないだろうか。
いずれにしても大問題だが、県警や管理会社に問い合わせて回答してもらえるものだろうか。

この記事に頂いたコメント

Re: 岡崎市立中央図書館に電話してみた by DRE    2010/06/22 14:00
http://www.aichi-pref-library.jp/oudan/aichi_oudan_f.htm 愛蔵君を使ってレスポン...
Re: 岡崎市立中央図書館に電話してみた by k    2010/07/18 12:39
管理会社としては、自分のトコの落ち度よりも 謎の攻撃者による仕業ってほうが都合が...
Re: 岡崎市立中央図書館に電話してみた by ntop    2010/09/02 23:43
流石に管理者さん電話するとはお見事です。 本日(2010/9/1)に、図書館側の公式コメ...

■ 関連記事

詳細はこの日の詳細から

2010年06月24日(木)<< 前の日記 | 次の日記 >>
この日の詳細

■1クロールとDoSの違いと業務妨害罪と[法律][無断リンク][電子自治体] このエントリーをはてなブックマークに追加

#Librahack[http://twitter.com/search?q=%23librahack] の議論。多く登場する「スクレイピング」と書こうと思ったけれども、クロールで得たHTMLの後処理がスクレイピングだから、ここでは「クロール」対「DoS」とした。
そもそも、クロールとDoSは行っている側の目的に決定的な違いがある。
クロールを行う際は、クロールによって相手サーバの情報を取得することが目的だ。そのために、リクエストに対する応答を受け取って、そのまま保存するなり、何らかの加工(スクレイピング)を行って、情報を保存する。 情報を得るのが目的だから、サーバが落ちるのは困る立場だ。
一般的な作りとしては、ページのリクエストを出して、結果を受け取ったら、その場で解釈して、次にリクエストを出すページを決めるか、あるいは予め予定している次のページのリクエストを出す。この間に待ち時間を入れる。例えば、 1秒に1リクエストといった、一定間隔でリクエストを出す様な実装は、まずしない 。そういう風にクローラを実装するのは、難しい上に、トラブルを引き起こしやすいからだ。問題のスクリプトも リクエストは同時に複数送信しない、リクエストの応答が返ってきてから次のリクエストを送信する[http://librahack.jp/okazaki-library-case/stress-test-thinking.html] 構造であると言う。
一方、DoSは、サービスを妨害するのが目的で行う行為だ。一般的なサーバでは、ページを取得し続けるだけでサーバ停止することは無いから、ページを大量に順次取得することによってDoSを達成しようとするのは効率が悪い。
複数のプロセスを使って頑張っても、自分の回線の下り帯域幅を埋めるところまでで限界が訪れるし、Webサーバ側は能力を他のクライアントにも分配するから、他のクライアントは遅くなるとはいえ、サービスを受けることができる。
そこで、 DoS攻撃する立場に立つと、他の利用者と同じ様に結果を受け取る必要はない のだから、結果はそもそも捨てて掛って、応答を待たずに次のリクエストを送出してしまえば、より負荷を掛けることができる。
いわゆる F5アタック[http://ja.wikipedia.org/wiki/DoS%E6%94%BB%E6%92%83#F5.E3.82.A2.E3.82.BF.E3.83.83.E3.82.AF] でも、サーバの応答は待たないし、 もっと効率的にとなると、TCPレベルでFIN送らずにコネクション切って次のリクエストを出すとか、何らかの方法で第三者に間接的にリクエストを出させると言ったテクニックを駆使することになるが、いずれにせよ、結果を受け取る必要が無いから取り得る方法だし、ピンポイントでサーバの不具合を突くにしても、DoSが成功すれば、自分も情報が得られなくなるという結果は共通している。
ところで、サーバ管理者は、「DoSの様なクロール」というたとえをすることがあるが、やっていることがクロールだと理解した上で「DoSの様」と言っている。
サーバ側から観測した時に、相手が行っているのが過剰なクロール *1 か、あるいはDoSなのかは、Webサーバのログでも大体見当は付く *2 し、パケットキャプチャして、TCPセッションを時系列にグラフ化してやれば、まず間違いなく *3 DoSを行っているに違いないと断言できる記録が得られるに違いない。
従って、今回のケースにおいても、被害届を出す前に、ログを子細に確認するか、あるいは警察が捜査の過程でログを解析していれば、 過剰なクロールを行われた結果、サーバ停止に至った。 という結論が得られていたか、逆にDoSと判断したのであれば、DoSであることを立証するに足る証拠集めをサーバ側で行う必要があった *4 筈である。
それらの手続きを行わずに、逮捕に至った事は非常に残念だ。 業務を妨害しようとしているに違いないという予断があったのか、とりあえず逮捕して自白を取りさえすれば公判が維持できると考えたのか、警察や検察の判断の根拠にも関心がある。

無断リンク禁止教に新宗派、無断クロール禁止教:

robots.txtに従わなかったこと[http://www.nantoka.com/~kei/diary/?20100526S2] が問題なのか。この点に関心を持っている。
例えば、Webサーバの利用規約に「スクリプト等による自動アクセスは、業務の妨げになるため行わないこと」と書いてあって、実際、このサーバは自動アクセスされると落ちてしまう様なサーバだったとすると、これに反してクロールし、業務が妨げられた場合には、業務妨害罪を構成するのだろうか。robots.txtに書いてあった場合はどうだろうか。
刑事上の判断はさておき、民事上の問題も考慮すれば、一般的な利用者はクロールをためらうだろう。
この議論、変な方向に行くと 無断リンク禁止教[http://www.nantoka.com/~kei/diary/?20050203S3] に新宗派ができて、自治体のシステムを作る時のテンプレとして、自動アクセス禁止を利用規約に盛り込んだり、robots.txtで全てのクロールを禁止したりという事が行われるようになったりしないかと危惧している。
ロボットによるクロールは、知る権利の保証を裏付けするために一定の役割を果たしている。普通の人は辿りつけない様なページに「公開」することで、「Webで公開しているから、情報公開の責務を果たしている」と言う主張を認めても良いものだろうか。

三菱図書館システム MELIL/CS[http://www.mdis.co.jp/case/city-okazaki/200908.html]:

この図書館、 三菱電機インフォメーションシステムズ[http://www.mdis.co.jp/] 社内で 論文[http://www.mdis.co.jp/company/techpaper/2009/0907_melil.pdf] になる程の、素晴らしいシステムが利用されている様で、 このシステムは、 全国多くの図書館で利用されている[http://www.asahi-net.or.jp/~gb4k-ktr/indexjv.htm#melil]
これだけの図書館で利用されながら、今回の様な問題が生じなかったということは、恐らく、Webのフロントエンドをカスタマイズする際に、何らかの手違いがあったのだろう。 いくらなんでも、この品質のパッケージを全国で展開していて、問題になっていないとは考えにくい。
確認した限りでは、岡崎市立図書館だけが、 件の謎の挙動[http://www.nantoka.com/~kei/diary/?20100621S1#T201006211S1] を示すようだ。

7月14日追記:

岡崎市立図書館だけではなく、検索文字列に依存したものでも無いことが分かったので、 続・クロールとDoSの違いと業務妨害罪と[http://www.nantoka.com/~kei/diary/?20100714S1] として、続報を書いた。
*1: サーバにとって過剰。クローラは欲張っているに過ぎない。
*2: DoSの場合、明らかに応答を受け取れないだろうという間隔でリクエストを発行してくる様な特徴がある。効率的な攻撃を行った時ほど、特徴は現れやすい。DDoSはやや見分けにくいかも知れないが、何かが進行中ということについては分かりやすいだろう。
*3: 間違いがあるとすれば、複数プロセスあるいはスレッドを駆使して、TCPを自前でしゃべる様な特殊なクローラを実装しようとした人が、ローカルでテストをせずに他人のサーバにアクセスしたといった、かなり申し開きが難しいケースだろう。
*4: もちろん、利用者のアクセスのプライバシーに対する十分な配慮が必要になるが。

■ 関連記事

詳細はこの日の詳細から

2010年06月29日(火)<< 前の日記 | 次の日記 >>
この日の詳細

■1借りてきた本[長崎][歴史][book] このエントリーをはてなブックマークに追加

出島の歴史に関して調べたいことがあったので、郷土資料を借り出し。

[大型本]出島図―その景観と変遷[http://www.amazon.co.jp/%E5%87%BA%E5%B3%B6%E5%9B%B3%E2%80%95%E3%81%9D%E3%81%AE%E6%99%AF%E8%A6%B3%E3%81%A8%E5%A4%89%E9%81%B7-%E9%95%B7%E5%B4%8E%E5%B8%82%E5%87%BA%E5%B3%B6%E5%8F%B2%E8%B7%A1%E6%95%B4%E5%82%99%E5%AF%A9%E8%AD%B0%E4%BC%9A/dp/4805501588%3FSubscriptionId%3DAKIAIYKMKBZLJ3Y55SZA%26tag%3Dws%26linkCode%3Dxm2%26camp%3D2025%26creative%3D165953%26creativeASIN%3D4805501588]:

[単行本]長崎出島オランダ異国事情 (角川叢書)[http://www.amazon.co.jp/%E9%95%B7%E5%B4%8E%E5%87%BA%E5%B3%B6%E3%82%AA%E3%83%A9%E3%83%B3%E3%83%80%E7%95%B0%E5%9B%BD%E4%BA%8B%E6%83%85-%E8%A7%92%E5%B7%9D%E5%8F%A2%E6%9B%B8-%E8%A5%BF-%E5%92%8C%E5%A4%AB/dp/4047021288%3FSubscriptionId%3DAKIAIYKMKBZLJ3Y55SZA%26tag%3Dws%26linkCode%3Dxm2%26camp%3D2025%26creative%3D165953%26creativeASIN%3D4047021288]:

[単行本]オランダ商館長の見た日本―ティツィング往復書翰集[http://www.amazon.co.jp/%E3%82%AA%E3%83%A9%E3%83%B3%E3%83%80%E5%95%86%E9%A4%A8%E9%95%B7%E3%81%AE%E8%A6%8B%E3%81%9F%E6%97%A5%E6%9C%AC%E2%80%95%E3%83%86%E3%82%A3%E3%83%84%E3%82%A3%E3%83%B3%E3%82%B0%E5%BE%80%E5%BE%A9%E6%9B%B8%E7%BF%B0%E9%9B%86-%E6%A8%AA%E5%B1%B1-%E4%BC%8A%E5%BE%B3/dp/464203398X%3FSubscriptionId%3DAKIAIYKMKBZLJ3Y55SZA%26tag%3Dws%26linkCode%3Dxm2%26camp%3D2025%26creative%3D165953%26creativeASIN%3D464203398X]:

[単行本]長崎出島―甦るオランダ商館 (日本の遺跡)[http://www.amazon.co.jp/%E9%95%B7%E5%B4%8E%E5%87%BA%E5%B3%B6%E2%80%95%E7%94%A6%E3%82%8B%E3%82%AA%E3%83%A9%E3%83%B3%E3%83%80%E5%95%86%E9%A4%A8-%E6%97%A5%E6%9C%AC%E3%81%AE%E9%81%BA%E8%B7%A1-%E5%B1%B1%E5%8F%A3-%E7%BE%8E%E7%94%B1%E7%B4%80/dp/4886214398%3FSubscriptionId%3DAKIAIYKMKBZLJ3Y55SZA%26tag%3Dws%26linkCode%3Dxm2%26camp%3D2025%26creative%3D165953%26creativeASIN%3D4886214398]:

恋も仕事も事件もあった出島生活:

恋も仕事も事件もあった出島生活
著者:長崎市出島復元整備室/監修, 長崎市広報課/企画・編集
出版者:長崎市
出版年:2001-04

■ 関連記事

詳細はこの日の詳細から

以上、28 日分です。

指定日の日記を表示

前月 2010年06月 翌月
1 2 3 4 5
6 7 8 9 10 11 12
13 14 15 16 17 18 19
20 21 22 23 24 25 26
27 28 29 30

最近の日記

2019年04月01日

新元号「令和」について

2019年03月23日

DXアンテナ ワイヤレスチューナー メディアコンセント DMC10F1

2019年02月17日

#例のグラボを活用する

2019年01月03日

シリーズ5・myHomeAlexaで自分のCDをかける

2018年12月25日

シリーズ4・英語の楽曲・アルバム・アーティスト名をカタカナに直す

2018年12月23日

シリーズ3: Echo Dotがやってきた

2018年12月19日

続・Echo Dotがやってきた

分野別タイトル一覧


全て
CLIP
SYA!nikki
book
freebsd
hns
magic
おさけ
おしごと
お買いもの
ぐる
ごはん
アクセシビリティ
オープンソース
セキュリティ
音楽
地域情報化
電子自治体
日記

keikuma on Twitter

keikuma Name:前田勝之
Location:長崎市
Web:http://www.nantok...
Bio:前田勝之(まえだかつゆき)。長崎在住。コンサル、SE、プログラマー、 なんとか株式会社代表、非常勤講師(情報セキュリティ)。 セキュアド、テクニカルエンジニア(SV,NW)。サーバ管理とWeb日記を10年ほど。 ネットとリアルの接点に関心あり。食べること・歌うこと・愛すること・作ること・飲むこと。おいしいものがぜんぶすき。

サイト内検索

Google AdSense

Powered by hns-2.19.9, HyperNikkiSystem Project