Ian 懶惰蟲筆記: 4月 2008

2008年4月26日星期六

1024 人應援團 - 圖片產生器

日本很酷的網站，只要選擇電腦裡的圖片後，點選『応援してもらう!』，稍待片刻就有由 1024 人拿著牌子拼出你的圖片喔！

還分平日是制服應援團，土日（週六）是私服應援團，支援 GIF, JPEG, PNG 三種類型，500KB 以下的圖片。

此外還提供了產生 PDF 檔，可列印出來製作成 3D 立體 1024 人應援團紙卡喔！

1024 人應援團 3D

偽基百科欣然宣佈，作為偽客觀、偽公正、偽持平、偽學術、專事挖苦的惡搞百科全書，由 2006 年 5 月 20 日至今，我們的蟲子條目數量已達到 4,301 條了！我們的雞吃的太飽了！

別懷疑是『偽基百科』，不是『維基百科』，首頁標頭就這麼惡搞了，今天是 2008 年 4 月 26 日，我實在是太晚發現這麼好玩的地方了。

小孩 - 偽基百科

重點並非介紹這篇名為『小孩』的惡搞文，讓我覺得最有趣的是在最上方的那兩個區塊，不愧是『偽基百科』。

注意：糟糕物
這個主題因為大量「奶油犬」攻擊而充滿了十八禁的內容，繼而吸引大量「奶油狼」入侵。
在瀏覽本主題時，請注意周圍人士的手上是否拿著可以當凶器的物品，以免遭遇不測。
P.S.：未滿十八歲者請由邪惡的大人陪同瀏覽本主題，謝謝合作。

為了照顧那些幽默感退化的人們，維基百科有一個主題關於︰兒童。

到台灣找我玩，同志！ - 到台灣玩不帶走一張發票

是個針對大陸同胞交流和推廣台灣旅遊的網站，其中值得一提的是，該網站發起『到台灣玩不帶走一張發票，倡導大陸赴台遊客捐發票公益串聯活動』。

您只要將下方 HTML 碼複製後，貼在自己的 blog 頁面上，即可讓逛到您 blog 的訪客看到活動貼紙，並鏈接到活動倡議網頁，讓更多網民分享到台灣隨手行善的喜樂。
 <a href="http://www.comeseemeintaiwancomrade.com/invoice/" target="_blank"><img src="http://www.comeseemeintaiwancomrade.com/img/ad12060_invoice.gif" width="120" height="60" border="0" alt="到台湾玩不带走一张发票" title="到台湾玩不带走一张发票"></a> 

之前還有個『兩岸俗語通 MSN 表情文化會館』，很有趣的單元，收集了許多兩岸網友的俗語會話，有漢語拼音、說明、典故及例句，並製作成 MSN 表情圖案，讓你平常就能夠看圖學習兩岸語言。

台湾俗语简体馆 - 林老师 Lin Lao Shi / [淨化的後宣洩语]

含蓄地表示不满之情绪
典故︰台湾素有较为粗俗的宣泄用语，以指称「您母亲比较良好」的方式来怒骂对方。近代以来有人改以指称「您老师比较良好」的方式，并略带开玩笑的情绪，来代替先前以「母亲」为主题的不雅用词。却又因为台语的「您」与普通话的「林」谐音，渐渐地又有人以更含蓄且简化的方式，改以「林老师」来宣泄不满之情绪。

內地俗語繁體館 - 好使 Hao Shi / [形容詞]

形容物或人用起來令人覺得好用、起勁、得心應手。
例句 A︰快告訴我啥牌子的減肥藥好使？
例句 B︰唉！我老囉！腦子不好使。
例句 C︰他這人聰明又有熱誠，挺好使的！

很有意思吧，不過已經在 2007/10/22 停止繼續維護，該單元沒有關閉有興趣的人可以去看看。

官方首页︰

2008年4月17日星期四

RSS 2.0 的規格

RSS 是一種網頁內容聚合格式，為 Really Simple Syndication 的縮寫，是一種消息來源格式規範，用以發佈經常更新資料的網站，例如部落格文章、新聞、音訊或視訊的網摘。RSS 文件包含了全文或是節錄的文字，加上發行者的相關資訊及版權宣告等。訂閱者只要透過 RSS 閱讀器（如 Google 閱讀器），就可看到即時更新的內容。

所有的 RSS 文件都必須符合 XML 1.0 的規範。在最外層是一個 <rss> 並定義所順應的規格版本，往下由單一個 <channel> 以及多個 <item> 元素所組成。

RSS 的結構應該大致長得像這樣：
 <?xml version="1.0" encoding="utf-8"?> <rss version="2.0"> <channel> <title>Ian 懶惰蟲筆記</title> <link>http://ianjung1974.blogspot.com/</link> <description>Ian 懶惰蟲筆記簡介</description> ... ... <item> ... ... </item> <item> ... ... </item> <item> ... ... </item> </channel> </rss> 
以下簡短說明 RSS 2.0 的規格：

必須的 channel 元素

title：此「channel」的名稱，供人識別你提供的資料，通常設成網站的標題即可。

link：你的網站 URL。

description：網站或此 RSS 服務的簡介。

選擇性的 channel 元素

language：語系，如「en-us」、「zh-tw」等，參考或 W3C 的定義。

managingEditor：RSS 內容負責人的 E-Mail。

webMaster：技術負責人的 E-Mail。

pubDate：內容發佈日期，比如日報的發佈應該會每天更新一次。日期時間的規格遵循 RFC 822 的標準。例：「Sat, 07 Sep 2002 00:00:01 GMT」。

lastBuildDate：本 RSS 內容的最後更新時間，如：「Sat, 07 Sep 2002 09:42:31 GMT」。

category：指出一或多個本 RSS 的性質分類，供 RSS 目錄系統使用，語法和 item 之中 category 的一樣，參考。

generator：產生此 RSS 的程式名稱。

docs：敘述此 RSS 之格式的文件網址，也可將其指向 http://blogs.law.harvard.edu/tech/rss。

cloud：註冊以得到更新訊息的方式，如：「<cloud domain="rpc.sys.com" port="80" path="/RPC2" registerProcedure="pingMe" protocol="soap"/>」，參考。

ttl：本 RSS 內容的有效期限，即 RSS 閱讀器可以將此 RSS 快取住多久的時間，單位為分鐘，參考。

image：提供一個 GIF, JPEG 或 PNG 檔來代表此 RSS，參考。

rating：內容分級制度評分，請參考 PICS。

textInput：呈現一個可輸入文字的欄位，參考。

skipHours：告訴訂閱程式哪些小時可以跳過，參考。

skipDays：告訴訂閱程式哪些日期可以跳過，參考。

item 元素

title：此 item 的標題。

link：此 item 的網址。

description：此 item 的概述。

author：此 item 作者的 E-Mail，參考。

category：此 item 的分類，參考。

comments：與此 item 相關評論的網址，參考。

enclosure：此 item 內載的多媒體內容，參考。

guid：此 item 的索引（唯一識別碼），通常也是網址，參考。

pubDate：此 item 的發佈日期，參考。

source：此 item 最新內容的 XML 網址，參考。

W3C - Language codes，ISO 639 語言代碼，ISO 3166 標準國家代碼，ISO 4217 貨幣代碼

現在有許多網站都有提供多國語系的版本，例如 iGoogle 首頁（http://www.google.com/ig?hl=zh-tw），其中（zh-tw）便是在 Google 繁體中文的代碼。但各家網站所使用的語系代碼都不太相同，例如有些網站就把繁體中文代碼直接簡化成（tw）。其實這些都沒有錯，只要本身系統區分的出來就好。

但是我的想法偏向比較標準的定義，在全球資訊網聯盟（World Wide Web Consortium，簡稱︰W3C）有了相關定義，在 8.1.1 Language codes 中定義了表示法如下︰

language-code = primary-code ( "-" subcode )*
primary-code︰為 ISO 639 兩個字母的語言縮寫。
subcode︰為 ISO 3166 國家代碼

在國際標準化組織（英文：International Organization for Standardization，簡稱︰ISO） ISO 639 為各語言所訂定的語言代碼，在 ISO 639-1 中定義了中文、漢語的語言代碼為（zh）。但是中文又區分為繁體中文及簡體中文，這部份通常是在後面加上使用該語言的國家和地區代碼來作為區分。例如︰繁體中文為中華民國、台灣（tw）在使用，那麼繁體中文的語言代碼就可以定義為（zh-tw）；簡體中文為中華人民共和國（cn）在使用，所以簡體中文的語言代碼定義為（zh-cn）。

至於國家和地區代碼就必須參考 ISO 3166 中 ISO 3166-1 所定義的標準國家代碼，其中包含有二位字母、三位字母、數字代碼，在語言區分通常是使用二位字母代碼。我們更可以利用 ISO 3166-1 中所定義的數字代碼作為系統其他資料國家記錄所使用的代碼，例如︰紀錄會員資料的國家別。

另外還有 ISO 4217 為貨幣及基金代碼，這些我們都可以用來作為資料紀錄的標準。

相關資料︰
W3C 全球資訊網聯盟
 Wikipedia - 全球資訊網聯盟
 W3C - 8.1.1 Language codes

ISO 國際標準化組織的官方網站
 Wikipedia - 國際標準化組織
 Wikipedia - ISO 639
Wikipedia - ISO 639-1
Wikipedia - ISO 3166
Wikipedia - ISO 3166-1
Wikipedia - ISO 4217

2008年4月1日星期二

CDATA 區段 - XML 標準

XML 對於許多人都不陌生，但還是有些地方大家不知道該如何使用，例如現在所要介紹的 CDATA 區段。

在某些時候內容中含有 HTML 標籤或者是一些特殊字元﹙如﹕<、>、&﹚，當這些字元出現在內容裡，通常都會出現 XML 分析錯誤的情況，這時候就必須將這些字元作些轉換的工作（如︰< / <、> / >、& / &）。

其實並不需要如此，CDATA 區段提供了一種通知剖析器的方法，說明 CDATA 區段所包含的字元沒有標記。

當 XML 剖析器遇到開頭的『<![CDATA[』，會將接下來的內容報告成字元，而不會嘗試將其解譯成項目或實體標籤。字元參考不能在 CDATA 區段內運作。當它遇到結尾的『]]>』時，剖析器會停止報告並回到正常的剖析，這也能使用在 HTML 文件中。使用方法為︰
 <![CDATA[這裡面內容包含了 HTML 標籤，以前一些特殊字元 & 所以要使用 CDATA 區段包起來]]> 
以下面商品資料文件 PDI0120080331195202.xml 為範例，其中 PDI01DOC.DocContent.Item.ProductUrl 為商品頁面的網址，內容包含了 & 字元；PDI01DOC.DocContent.Item.ProductDesc 為商品說明，內容包含了大量 HTML 標籤。所以這兩個內容我們都用使用了 CDATA 區段包起來，如此 XML 剖析器就能正常剖析了。

PDI0120080331195202.xml
 <?xml version="1.0" encoding="utf-8"?> <PDI01DOC> <DocHead> <DocNo>PDI0120080331195202</DocNo> <ItemCounts>2</ItemCounts> </DocHead> <DocContent> <Item> <ProductId>DGAD0I-A16867929-000</ProductId> <ProductName>SONY Cyber-Shot T2 (公司貨)</ProductName> <ProductUrl><![CDATA[http://shopping.pchome.com.tw/?mod=item&func=exhibit&IT_NO=ABAL1S-A17289270]]></ProductUrl> <ProductPrice>11980</ProductPrice> <ProductDesc><![CDATA[■ 810萬高品質畫素 ■ 2.7吋觸控式LCD寬螢幕 ■ 3倍光學變焦 ■ 4GB 內置記憶體 ■ 超強1cm微距近拍 ■ 先進的臉部偵測技術 ■ ISO 3200 高感光能力 ■ 雙重防手震技術 ■ 創新的微笑快門功能 ■ 原廠公司貨原廠18個月保固 ■本商品為精裝包組合：內含Sony 原廠時尚相機包（LCS-TWE/P）及觸控筆掛飾各乙個 ㊣獨家送您貼心好禮：USB空氣清靜機]]></ProductDesc> </Item> <Item> <ProductId>ABAL1Z-A17679297</ProductId> <ProductName>Panasonic DMC-FX33(公司貨)</ProductName> <ProductUrl><![CDATA[http://shopping.pchome.com.tw/?mod=item&func=exhibit&IT_NO=ABAL1Z-A17679297]]></ProductUrl> <ProductPrice>9990</ProductPrice> <ProductDesc><![CDATA[■810萬畫素 ■3.6倍光學變焦 ■德國徠卡鏡頭 ■光學防手震 ■ISO 6400高感光 ■2.5吋大螢幕 ■28mm廣角鏡頭 ■iA 智能自動模式 ■整合雙重防震 ■臉部對焦及自動場景選擇功能 ■送4G記憶卡+專用鋰電池+讀卡機+清潔組+保護貼+原廠皮套]]></ProductDesc> </Item> </DocContent> </PDI01DOC>