2008年4月26日 星期六

1024 人應援團 - 圖片產生器

日本很酷的網站,只要選擇電腦裡的圖片後,點選『応援してもらう!』,稍待片刻就有由 1024 人拿著牌子拼出你的圖片喔!

還分平日是制服應援團,土日(週六)是私服應援團,支援 GIF, JPEG, PNG 三種類型,500KB 以下的圖片。





此外還提供了產生 PDF 檔,可列印出來製作成 3D 立體 1024 人應援團紙卡喔!

1024 人應援團 3D

偽基百科,連名字也是「惡搞」的!

偽基百科欣然宣佈,作為偽客觀、偽公正、偽持平、偽學術、專事挖苦的惡搞百科全書,由 2006 年 5 月 20 日至今,我們的蟲子條目數量已達到 4,301 條了!我們的雞吃的太飽了!

別懷疑是『偽基百科』,不是『維基百科』,首頁標頭就這麼惡搞了,今天是 2008 年 4 月 26 日,我實在是太晚發現這麼好玩的地方了。



小孩 - 偽基百科

重點並非介紹這篇名為『小孩』的惡搞文,讓我覺得最有趣的是在最上方的那兩個區塊,不愧是『偽基百科』。




Image:Adult neon.gif
注意:糟糕物
這個主題因為大量「奶油犬」攻擊而充滿了十八禁的內容,繼而吸引大量「奶油狼」入侵。
在瀏覽本主題時,請注意周圍人士的手上是否拿著可以當凶器的物品,以免遭遇不測。
P.S.:未滿十八歲者請由邪惡的大人陪同瀏覽本主題,謝謝合作。



為了照顧那些幽默感退化的人們,維基百科有一個主題關於︰兒童

到台灣找我玩,同志! - 到台灣玩不帶走一張發票

是個針對大陸同胞交流和推廣台灣旅遊的網站,其中值得一提的是,該網站發起『到台灣玩不帶走一張發票,倡導大陸赴台遊客捐發票公益串聯活動』。

您只要將下方 HTML 碼複製後,貼在自己的 blog 頁面上,即可讓逛到您 blog 的訪客看到活動貼紙,並鏈接到活動倡議網頁,讓更多網民分享到台灣隨手行善的喜樂。

到台湾玩不带走一张发票

之前還有個『兩岸俗語通 MSN 表情文化會館』,很有趣的單元,收集了許多兩岸網友的俗語會話,有漢語拼音、說明、典故及例句,並製作成 MSN 表情圖案,讓你平常就能夠看圖學習兩岸語言。

台湾俗语简体馆 - 林老师 Lin Lao Shi / [淨化的後宣洩语]

含蓄地表示不满之情绪
典故︰台湾素有较为粗俗的宣泄用语,以指称「您母亲比较良好」的方式来怒骂对方。近代以来有人改以指称「您老师比较良好」的方式,并略带开玩笑的情绪,来代替先前以「母亲」为主题的不雅用词。却又因为台语的「您」与普通话的「林」谐音,渐渐地又有人以更含蓄且简化的方式,改以「林老师」来宣泄不满之情绪。

內地俗語繁體館 - 好使 Hao Shi / [形容詞]

形容物或人用起來令人覺得好用、起勁、得心應手。
例句 A︰快告訴我啥牌子的減肥藥好使?
例句 B︰唉!我老囉!腦子不好使。
例句 C︰他這人聰明又有熱誠,挺好使的!

很有意思吧,不過已經在 2007/10/22 停止繼續維護,該單元沒有關閉有興趣的人可以去看看。


官方首页︰

2008年4月17日 星期四

RSS 2.0 的規格

RSS 是一種網頁內容聚合格式,為 Really Simple Syndication 的縮寫,是一種消息來源格式規範,用以發佈經常更新資料的網站,例如部落格文章、新聞、音訊或視訊的網摘。RSS 文件包含了全文或是節錄的文字,加上發行者的相關資訊及版權宣告等。訂閱者只要透過 RSS 閱讀器(如 Google 閱讀器),就可看到即時更新的內容。

RSS

所有的 RSS 文件都必須符合 XML 1.0 的規範。在最外層是一個 <rss> 並定義所順應的規格版本,往下由單一個 <channel> 以及多個 <item> 元素所組成。

RSS 的結構應該大致長得像這樣:

以下簡短說明 RSS 2.0 的規格:

必須的 channel 元素


  • title:此「channel」的名稱,供人識別你提供的資料,通常設成網站的標題即可。

  • link:你的網站 URL。

  • description:網站或此 RSS 服務的簡介。


選擇性的 channel 元素

  • language:語系,如「en-us」、「zh-tw」等,參考W3C 的定義

  • copyright:版權宣告。

  • managingEditor:RSS 內容負責人的 E-Mail。

  • webMaster:技術負責人的 E-Mail。

  • pubDate:內容發佈日期,比如日報的發佈應該會每天更新一次。日期時間的規格遵循 RFC 822 的標準。例:「Sat, 07 Sep 2002 00:00:01 GMT」。

  • lastBuildDate:本 RSS 內容的最後更新時間,如:「Sat, 07 Sep 2002 09:42:31 GMT」。

  • category:指出一或多個本 RSS 的性質分類,供 RSS 目錄系統使用,語法和 item 之中 category 的一樣,參考

  • generator:產生此 RSS 的程式名稱。

  • docs:敘述此 RSS 之格式的文件網址,也可將其指向 http://blogs.law.harvard.edu/tech/rss。

  • cloud:註冊以得到更新訊息的方式,如:「<cloud domain="rpc.sys.com" port="80" path="/RPC2" registerProcedure="pingMe" protocol="soap"/>」,參考

  • ttl:本 RSS 內容的有效期限,即 RSS 閱讀器可以將此 RSS 快取住多久的時間,單位為分鐘,參考

  • image:提供一個 GIF, JPEG 或 PNG 檔來代表此 RSS,參考

  • rating:內容分級制度評分,請參考 PICS

  • textInput:呈現一個可輸入文字的欄位,參考

  • skipHours:告訴訂閱程式哪些小時可以跳過,參考

  • skipDays:告訴訂閱程式哪些日期可以跳過,參考


item 元素

  • title:此 item 的標題。

  • link:此 item 的網址。

  • description:此 item 的概述。

  • author:此 item 作者的 E-Mail,參考

  • category:此 item 的分類,參考

  • comments:與此 item 相關評論的網址,參考

  • enclosure:此 item 內載的多媒體內容,參考

  • guid:此 item 的索引(唯一識別碼),通常也是網址,參考

  • pubDate:此 item 的發佈日期,參考

  • source:此 item 最新內容的 XML 網址,參考


相關資料︰
RSS 2.0 Specification
Extensible Markup Language (XML) 1.0 (Fourth Edition)
RSS - 維基百科,自由的百科全書

W3C - Language codes,ISO 639 語言代碼,ISO 3166 標準國家代碼,ISO 4217 貨幣代碼

現在有許多網站都有提供多國語系的版本,例如 iGoogle 首頁(http://www.google.com/ig?hl=zh-tw),其中(zh-tw)便是在 Google 繁體中文的代碼。但各家網站所使用的語系代碼都不太相同,例如有些網站就把繁體中文代碼直接簡化成(tw)。其實這些都沒有錯,只要本身系統區分的出來就好。

但是我的想法偏向比較標準的定義,在全球資訊網聯盟(World Wide Web Consortium,簡稱︰W3C)有了相關定義,在 8.1.1 Language codes 中定義了表示法如下︰

language-code = primary-code ( "-" subcode )*
primary-code︰為 ISO 639 兩個字母的語言縮寫。
subcode︰為 ISO 3166 國家代碼

在國際標準化組織(英文:International Organization for Standardization,簡稱︰ISO) ISO 639 為各語言所訂定的語言代碼,在 ISO 639-1 中定義了中文、漢語的語言代碼為(zh)。但是中文又區分為繁體中文及簡體中文,這部份通常是在後面加上使用該語言的國家和地區代碼來作為區分。例如︰繁體中文為中華民國、台灣(tw)在使用,那麼繁體中文的語言代碼就可以定義為(zh-tw);簡體中文為中華人民共和國(cn)在使用,所以簡體中文的語言代碼定義為(zh-cn)。

至於國家和地區代碼就必須參考 ISO 3166 中 ISO 3166-1 所定義的標準國家代碼,其中包含有二位字母、三位字母、數字代碼,在語言區分通常是使用二位字母代碼。我們更可以利用 ISO 3166-1 中所定義的數字代碼作為系統其他資料國家記錄所使用的代碼,例如︰紀錄會員資料的國家別。

另外還有 ISO 4217 為貨幣及基金代碼,這些我們都可以用來作為資料紀錄的標準。

相關資料︰
W3C 全球資訊網聯盟
Wikipedia - 全球資訊網聯盟
W3C - 8.1.1 Language codes

ISO 國際標準化組織的官方網站
Wikipedia - 國際標準化組織
Wikipedia - ISO 639
Wikipedia - ISO 639-1
Wikipedia - ISO 3166
Wikipedia - ISO 3166-1
Wikipedia - ISO 4217

2008年4月1日 星期二

CDATA 區段 - XML 標準

XML 對於許多人都不陌生,但還是有些地方大家不知道該如何使用,例如現在所要介紹的 CDATA 區段。

在某些時候內容中含有 HTML 標籤或者是一些特殊字元﹙如﹕<、>、&﹚,當這些字元出現在內容裡,通常都會出現 XML 分析錯誤的情況,這時候就必須將這些字元作些轉換的工作(如︰< / &lt;、> / &gt;、& / &amp;)。

其實並不需要如此,CDATA 區段提供了一種通知剖析器的方法,說明 CDATA 區段所包含的字元沒有標記。

當 XML 剖析器遇到開頭的『<![CDATA[』,會將接下來的內容報告成字元,而不會嘗試將其解譯成項目或實體標籤。字元參考不能在 CDATA 區段內運作。當它遇到結尾的『]]>』時,剖析器會停止報告並回到正常的剖析,這也能使用在 HTML 文件中。使用方法為︰

以下面商品資料文件 PDI0120080331195202.xml 為範例,其中 PDI01DOC.DocContent.Item.ProductUrl 為商品頁面的網址,內容包含了 & 字元;PDI01DOC.DocContent.Item.ProductDesc 為商品說明,內容包含了大量 HTML 標籤。所以這兩個內容我們都用使用了 CDATA 區段包起來,如此 XML 剖析器就能正常剖析了。

PDI0120080331195202.xml