2014-02-21

XML埋込の伝送では低水準の同一性が保証されなくなることとPubSubHubbubで全文フィードじゃなくてコールバックさせること

コールバックにもいいこともあるんだな、と気がついたので、メモ。

SRU、OAI-PMHなど、伝送すべきXML文書をサブツリーとして含み、まわりにメタデータが張り付いたようなものをHTTPレスポンスにするようなプロトコルはしばしばある。PubSubHubbubはAtomエントリをHTTP POSTするんだけど、全文フィードから抜いたエントリをPOSTしてその埋め込みデータを利用させることもできるし、要約フィードでURLだけ伝えてコールバックさせることもできる。

コールバックなんか無駄じゃんか、というとさにあらず。という屁理屈を考えてみた、ということになる。

パーザの文書ツリーに伝送すべきXML文書の読み込み結果を(次々)張り付けて、またシリアライズすると、属性まわりのスペースだとか、改行コードだとか、文字実体参照だとかは必ずしも元の文書のとおりに再現されるわけではない。ひどい場合には名前空間宣言がぐちゃぐちゃになったりする。もちろん、利用者がみなお行儀よろしくXMLインフォセットだけを見てくれればいいのだが、DOM APIで名前空間を無視してパーズしたり、ひどい場合には sed でタグを抜き出したりすると、そういう低水準の非保存性で災厄が起こる。決してやれとは言っていないがそういうことはあるし自分もやっつけ仕事でやったりする。

だから、信頼できるのは、オクテット列を忠実に伝送することしかないのだ、となることはある。なんたる荒廃といわれればその通りだが、まあ、そういうこともある。

I feel I need to write English version also, but the priority of the time is not here right now, sorry.

2014-02-20

セルビア語の硬音 n は歯音(だから日本語の歯茎音 n が軟音に聞こえるん)じゃないのか

セルビア語の n の発音が難しいという話。
https://twitter.com/adonis_fish/status/436356744445296640

n のときに舌が上がらないように気をつけて低い母音を続けても、やっぱり軟音に聞こえちゃうというんだろうから、調音点がずれてるんじゃないのか。

と思ってウィキペをみると、残念ながら n 硬音は歯茎音(つまり日本語と同じ)とある。
http://en.wikipedia.org/wiki/Serbo-Croatian_phonology#Consonants
t は歯音で n と調音点がずれちゃってるが、スペイン語の例もあるから、それだけであり得ないわけでもない。

でも、本当かな。

南スラブ語の仲間、ブルガリア語では n が歯音らしい。
http://en.wikipedia.org/wiki/Bulgarian_phonology#Consonants

そして、遠くなるけどロシア語では、n の硬軟が 歯音jなし-歯茎音jつき の対立になっている。
http://en.wikipedia.org/wiki/Russian_phonology#Consonants

というわけで、ロシア語風に発音されるのであれば、表題のようなセオリーにならんとも限らん。ような気がする。

以上、単なる半可通の憶測、まったく無保証であります。