Format mbox-a

Kako klijenti e-pošte čuvaju poštu na tvrdom disku

Najčešći format za čuvanje mail poruka je mbox format. MBOX označava MailBOX. Mbox je jedna datoteka koja sadrži nula ili više mail poruka.

Format mbox-a

Ako koristimo mbox format za čuvanje e-pošte, sve ih stavimo u jednu datoteku. Ovo stvara manje-više dugačku tekstualnu datoteku (Internet e-pošta uvijek postoji samo kao 7-bitni ASCII tekst, sve ostalo - prilozi, na primjer - kodirani su ) koji sadrže jednu email poruku za drugom. Kako da znamo gde se jedan završava, a drugi počinje?

Na sreću, svaka e-pošta ima na samom početku barem jednu Od-liniju. Svaka poruka počinje sa "From" (od toga slijedi znak bijelog prostora, također nazvan "From_" linija). Ako ovom nizu ("Od") na početku linije prethodi prazna linija ili je na vrhu datoteke, pronašli smo početak poruke.

Dakle, ono što tražimo kada je razradu mbox datoteke u suštini prazna linija praćena "From".

Kao regularni izraz, ovo možemo napisati kao "\ n \ nOdm. * \ N". Samo prva poruka je drugačija. Počinje samo sa "From" na početku linije ("^ From. * \ N").

& # 34; Od & # 34; u telu

Šta ako se tačno gornja sekvenca pojavljuje u telu poruke e-pošte? Šta ako je sledeći dio e-pošte?

... poslala sam vam najnoviji izveštaj.

Iz ovog izvještaja ne morate ...

Ovde imamo praznu liniju a zatim "Od" na početku linije. Ako se ovo pojavi u mbox datoteki, nepogrešivo imamo početak nove poruke. Bar to je ono što misli parser - i zašto i klijent e-pošte i mi bismo bili prilično zbunjeni putem e -poruke koja ne sadrži ni pošiljaoca niti primaoca, već počinje sa "Iz ovog izveštaja".

Da bi se izbegli takvi katastrofalni uslovi, moramo se uveriti da se "Od" nikada ne pojavljuje na početku linije koja sledi praznu liniju u telu e-pošte.

Kad god dodamo novu poruku mbox datoteki , tražimo takve sekvence u telu i jednostavno zamenimo "From" sa "> From". Ovo onemogućava pogrešne tumačenje. Primjer iznad sada izgleda ovako i više ne pokreće parser:

... poslala sam vam najnoviji izveštaj.

> Iz ovog izvještaja ne morate ...

Zbog toga možete nekada pronaći "> od" u e-mailu gdje biste očekivali samo "Od".