2010年10月31日()<< 前の日記 | 次の日記 >>
この日の詳細

■1 シリーズ・クロールとDoSの違いと業務妨害罪と(26) - 図書館WebサイトROBOTS.TXTについてのご案内[http://www.nantoka.com/~kei/diary/?20101029S1][LibraHack][電子自治体][図書館][セキュリティ] このエントリーをはてなブックマークに追加

図書館WebサイトROBOTS.TXTについてのご案内三菱電機インフォメーションシステムズが、9月14日付けで図書館各位宛に出した「図書館WebサイトROBOTS.TXTについてのご案内」という文書を入手した。 「ROBOTS.TXT」と大文字にしてしまってはまずいと思うのだが、なぜか大文字だ。
内容は既に、 2010年10月29日 17:07からのTweet[http://twitter.com/keikuma/status/29067328341] で記述したが、まとめて採録しておく。
robots.txt(goo、Google、Lycos などの ロボット型検索エンジンに対する命令を記述するためのファイルです。自分のページが、検索エンジンのデータベースに登録されないように指示します。)についてですが、当初弊社では 基本全て隠すことを前提として設計設定しておりました。
しかし、今年4月から国立国会図書館法が改正施行され、地方公共団体のWebページ情報の ロボット(クローラ)による自動収集を始めた。これを妨げる「ロボット除け」対策をしている地方図書館向けに、国立国会図書館のクローラを全フォルダに対し許容するよう、設定を書き換える指示を出していることを踏まえ、弊社としましても、 基本全て公開とする方針といたしました。
ついては、貴館にてサイト内のページ公開・非公開を確認・決定した上で、設定を実施していきたいと考えております。設定実施日ついては、貴館の都合に合わせて実施したく考えております。設定に際し、サーバの停止作業は発生いたしません。
「基本全て」とか「自動収集を始めた」とか、日本語がおかしいのはさておき、「ロボットに対する命令」「データベースに登録されないように指示します」「全て隠す」という説明は誤解を招くように思う。 robots.txtは何かを隠すと言うよりも、ロボットが迷わないで済むように設置するもの だからだ。
本当に隠したいコンテンツには、認証を設けるべきだし、 robots.txtに置き場所を書くなんてもっての外 だ。
以前に、 コピペ図書館問題[http://www.nantoka.com/~kei/diary/?20101005S1] を取り上げた際に、各図書館のページにある隠されたコンテンツを探し出すのに非常に役に立ったのが、まさにrobots.txtだった。
とある図書館に設置されていた、robots.txtの一部を以下に示す。
User-agent: *
Disallow: /tosho/
Disallow: /tosho/Acclog/
Disallow: /tosho/AdminTools/
Disallow: /tosho/Asp/ Disallow: /tosho/asp_misty/
Disallow: /tosho/Newbook/ Disallow: /tosho/text/ Disallow: /tosho/html/ Disallow: /tosho/i/Asp Disallow: /tosho/i/Newbook/ Disallow: / Disallow: /Acclog/
Disallow: /AdminTools/
Disallow: /Asp/ Disallow: /asp_misty/
Disallow: /Newbook/ Disallow: /html/ Disallow: /text/ Disallow: /i/Asp Disallow: /i/Newbook/
アクセスされると危険そうなパスが、明らかにされていることが分かる。
あるいは、ひょっとすると、 robots.txtで中身を隠せると本当に思っていたのかも知れない。

■ 関連記事

詳細はこの日の詳細から

2009年10月31日()<< 前の日記 | 次の日記 >>
この日の詳細

■1 汎用連想計算エンジンGETA[http://geta.ex.nii.ac.jp/][hns]次の記事 >> このエントリーをはてなブックマークに追加

関連文書検索に使えそうなプログラムの存在を教えてもらった。

■ 関連記事

■2 詰めViVi[http://vivi.dyndns.org/vivi/tsume/tsumevivi.phtml]<< 前の記事 | 次の記事 >> このエントリーをはてなブックマークに追加

■ 関連記事

■3入力フォームでのペースト禁止教[web]<< 前の記事 このエントリーをはてなブックマークに追加

その昔、 右クリック禁止教[http://anond.hatelabo.jp/20080126205050] というのが流行したことがあったが、最近似たような教派が流行する気配がある様だ。
確認を含めて2回メールアドレスを入力させる作りになっている入力フォームで、確認用の入力欄がペースト禁止にされていることがある。
onpasteやonkeydownのイベントを捕まえて、return falseすれば実現できるのだけれども、ペースト禁止にしている人たちは一体、何を思ってペースト禁止にしているのだろう。 メールアドレスの確認入力フォームは、ペースト禁止にするもんだという「ペースト禁止教」が広まっているのだろうか。
恐らく、「コピーしてペーストされると、2つとも同じ間違いを含んだアドレスが入力される可能性がある」と考えて、ペーストを禁止しているのだろうが、それならばコピーを禁止すべきで、ペーストを禁止するのはおかしい。
お仕着せの長いメールアドレスで、自分のアドレスを間違いなく打つのが大変で、日常的にコピー&ペーストで入力している人もいるわけで、間違いなくユーザビリティを下げている。
そういう人が手入力すると、2回とも入力を間違える事態も発生する訳で、そういうことを差し引くとわざわざ禁止することは無いだろう。
もっとも、ページの作り手側はそういうことをちゃんと分かっているのだが、ペースト禁止していないと、良く分かっていないクライアントから手抜きと評価される心配があるために、ペースト禁止しているのかも知れない。
簡単にできることをやらないで評価が下がる可能性があるのだったら、何も考えないで数行JavaScriptを埋め込んでおけば良い。
これが、「ペースト禁止教」流行のからくりかも知れない。
メールアドレスの入力欄のフォントを大きくするとか、確認画面で読みやすいフォントを使うとか、工夫できることはまだ他にもあるはずだ。

■ 関連記事

詳細はこの日の詳細から

2007年10月31日(水)<< 前の日記 | 次の日記 >>
この日の詳細

■1大切な人を無くした[mixi] このエントリーをはてなブックマークに追加

まだ信じられなくて実感が湧かない。
こういう時って、こういうものなのかな。

■ 関連記事

詳細はこの日の詳細から

2005年10月31日(月)<< 前の日記 | 次の日記 >>
この日の詳細

■1SYA!nikki[SYA!nikki]次の記事 >> このエントリーをはてなブックマークに追加

0008 ばんごはん:

中途半端な時間に目が醒めたのをよいことにルームサービスを。
「パルマ産生ハムと新鮮野菜のサラダピッツァ」なるものと、「牛フィレ肉のカツレツ粒マスタードソース」なるものらしい。飲み物は、ソアヴェ・クラシコ。
ばんごはん

■ 関連記事

■2出張10日目[おしごと]<< 前の記事 このエントリーをはてなブックマークに追加

今日ももちろん大変で、日付変わる後までばたばた。ホテルに戻ってからもドキドキなことが一件。まだまだピンチは続く。

■ 関連記事

詳細はこの日の詳細から

1998年10月31日()<< 前の日記 | 次の日記 >>
この日の詳細

■1Receivedヘッダの隠蔽 このエントリーをはてなブックマークに追加

ハッカー系のサイトも勉強になることが多いです。今日、第三者中継のニュースに上げた、「Receivedヘッダの隠蔽」はハッキング系のサイトを見て知りました。
少なくともsendmail8.8.8あたりでは、直っていないようです。動作も確認してsendmailのソースも検証しましたので、どこにどうパッチを当てれば直るということも指摘できるのですが、それをやると「どうすればそういうことができるか」ということも分かってしまうので書いてありません。どうしても知りたい方はメールください。
プログラムやOSネットワークを知り尽くしたいという知識欲や好奇心は責められる性質のものではありません。結果、セキュリティホールもどんどん発見され、より安全なシステムが出来上がってきた訳です。UNIXの歴史はハッキングの歴史ともいえるように思います。
その辺の事情を書いた本も出ているようですのでいずれご紹介したいと思っています。そこには、通常の人たちが及びもつかない知識欲と好奇心と情熱でシステムに立ち向かい、ピザやコークのわずかな報酬だけで様々な問題を解決して、現在のネットワークやOSを作り上げてきた生き生きとしたハッカー達の姿が想像できます。
現在はネットワークとコンピューターが研究者だけのものではなくなって、また一部のグル的ハッカー(従って、高度な倫理観を持っていた)だけが持っていたテクニックが倫理抜きに拡散している状況が違っているみたいです。本物のハッカー達には暮らしにくい時代になってしまいました。あ、ピザやコークもスシバーに変わったりしたみたいですね。
そうしたハッカー達の一部がフロンティアを求めてFreeBSDやLinuxの世界を作り上げたって言ったら言い過ぎでしょうか。

■ 関連記事

詳細はこの日の詳細から

以上、11 日分です。

指定日の日記を表示

前月 2020年01月 翌月
1 2 3 4
5 6 7 8 9 10 11
12 13 14 15 16 17 18
19 20 21 22 23 24 25
26 27 28 29 30 31

最近の日記

2019年04月01日

新元号「令和」について

2019年03月23日

DXアンテナ ワイヤレスチューナー メディアコンセント DMC10F1

2019年02月17日

#例のグラボを活用する

2019年01月03日

シリーズ5・myHomeAlexaで自分のCDをかける

2018年12月25日

シリーズ4・英語の楽曲・アルバム・アーティスト名をカタカナに直す

2018年12月23日

シリーズ3: Echo Dotがやってきた

2018年12月19日

続・Echo Dotがやってきた

分野別タイトル一覧


全て
CLIP
SYA!nikki
book
freebsd
hns
magic
おさけ
おしごと
お買いもの
ぐる
ごはん
アクセシビリティ
オープンソース
セキュリティ
音楽
地域情報化
電子自治体
日記

予定

    ToDo

      link

      keikuma on Twitter

      keikuma Name:前田勝之
      Location:長崎市
      Web:http://www.nantok...
      Bio:前田勝之(まえだかつゆき)。長崎在住。コンサル、SE、プログラマー、 なんとか株式会社代表、非常勤講師(情報セキュリティ)。 セキュアド、テクニカルエンジニア(SV,NW)。サーバ管理とWeb日記を10年ほど。 ネットとリアルの接点に関心あり。食べること・歌うこと・愛すること・作ること・飲むこと。おいしいものがぜんぶすき。

      サイト内検索

      Google AdSense

      Powered by hns-2.19.9, HyperNikkiSystem Project