[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

[plamo:10067] Re: 全角半角英数字の混ざったメールについて



From: Sumiya Sakoda <sakoda@toyoake.or.jp>
Message-Id: <wkk82mmaop.wl@BASEM17.oroshi.toyoake.or.jp>

> > 「テキストファイル」について深く追求してこないでね(笑)
> > メール出してから、「テキスト」という言葉の使い方がふと気になった。
> 
> いわれなければ普通にふーんそうかと思ってましたが、テキストファイルとは
> なんぞやといわれるとちょっと疑問に思ってしまいます。

SyntaxとSemanticsの両面で考えると分かりやすいです。

Syntax的には、表示可能文字 + 制御コードからなるもの。
Semantics的には、「テキストとして読める」もの、Plain Text。

たとえば、PostScriptは、Syntax的にはテキストだけど、Semantics的にはテ
キストじゃないとか。

ここでいっているテキストってのは、後者、つまりPlain Textですね。

ただ、HTMLやSGMLはどうなんだろう、と考えると、ちと悩ましい。

> これは単純にASCIIでありbinaryでないものとするならば、日本語を含むファ
> イルはテキストファイルでないともいいきっていいのかどうかとか。

もうひとつ、charset という概念を考えると、日本語を含むファイルは、
日本語のcharsetの文字によるテキストファイルと考えればいいですので、
US-ASCII以外をテキストじゃないと言い切るのはちょっと思想が古いかもしれ
ませんね。

# 文字コード情報を持たないテキストの構造が古い、とか言い出すと、んじゃ
# UNICODEに、とかいうことになって、さらに悩ましいかも :-)

> UNIXの場合、たいていの場合、拡張子は目安だと思うのですが、拡張子でほと
> んど挙動が決まるWindowsのデフォルトではなぜ拡張子を表示しないんだとつ
> い思ってしまいます。

わかりにくいものは全て隠す、という設計思想のたまものでしょうか。
考え方は正しいかもしれませんが実現方法が間違ってますよね。
# はじめから拡張子などやめにして、magicで判別すればいいのに。
--
田原 / jado@flowernet.gr.jp

Follow-Ups
[plamo:10076] Re: 全角半角英数字の混ざったメールについて, Sumiya Sakoda
References
[plamo:10061] Re: 全角半角英数字の混ざったメールについて, Chie Nakatani
[plamo:10063] Re: 全角半角英数字の混ざったメールについて, Chie Nakatani
[plamo:10066] Re: 全角半角英数字の混ざったメールについて, Sumiya Sakoda

[検索ページ] [メール一覧]
Plamo ML 公開システム