top / index / prev / next / target / source
日記形式でつづる いがぴょんコラム ウェブページです。
blanco Framework として Web巡回ソフトを開発することを妄想中です。 , 東京銀座のエノテーカ ピンキオーリというお店
blanco Framework として Web巡回ソフトを開発することを妄想中です。
特にイントラネット内の検索サイト作成のための基本キットみたいなのがあれば、これは便利だろうと思っています。オープンソースで公開されていて カスタマイズ可能であれば、これは役に立つ そんな気持ちがしました。
2007.10.14追記 ymotoさんの手により、名前は既に決められた様子です。
名前が決まったので、次に blancoWebCrawler を構成するサブプロダクトの設計に入ります。
blancoHttpGet (仮称) Webからhttpプロトコルを使って htmlを取得。転送を目的としたサブプロダクト。public byte[] get(final String uri) みたいな感じです。
blancoHtmlFormatter HTMLファイルを整形。この機能がないと HTML解析が面倒になるのかと思っています。
blancoHtmlParser 与えられた HTMLファイルをパースする。
リンクのマップ(?)を取得する (単にリンク先のアドレスを抽出するでも可。ポイントは ローカルアドレスの解決方法。URIでフルアドレスのほうが良いかも?)。
descriptionや keywordなども取得するのが良いです。
その他に、強調部分などのHTML構造から単語を類推する、テーブル構造から単語を類推する (?)
こんな感じかしら?
いとこの結婚式出席のため、東京銀座の エノテーカ ピンキオーリというお店に行きました。お店を丸ごと貸し切りでした。おいしかったです。おなかいっぱいです。
富士通が設計・生産工程を刷新、ソフト開発に“ものづくり”取り込む http://itpro.nikkeibp.co.jp/article/NEWS/20071012/284461/ 「トヨタ生産方式を取り入れたソフト開発」「設計書に標準的なモデルを適用することで、プログラムの自動生成などで効率を高めていく」あたりが気になりました。
XMLが嫌われている? http://itpro.nikkeibp.co.jp/article/COLUMN/20071011/284276/ 私は何年も前から XMLがキライだなぁ、と ふと思い出しました。