รูปแบบ mbox

ไคลเอ็นต์อีเมลจัดเก็บจดหมายบนฮาร์ดดิสก์ของคุณอย่างไร

รูปแบบที่พบมากที่สุดสำหรับการจัดเก็บจดหมายเมลคือรูปแบบ mbox MBOX ย่อมาจาก MailBOX mbox เป็นไฟล์เดียวที่มีข้อความอีเมลเป็นศูนย์หรือมากกว่า

รูปแบบ mbox

ถ้าเราใช้รูปแบบ mbox เพื่อจัดเก็บอีเมลเราจะใส่ไฟล์ทั้งหมดในไฟล์เดียว ซึ่งจะสร้างไฟล์ข้อความที่มีความยาวมากหรือน้อย (อีเมลทางอินเทอร์เน็ตจะมีอยู่เฉพาะในรูปแบบ ASCII 7 บิตทุกอย่างเช่นแนบไฟล์เป็นต้น) จะ ถูกเข้ารหัส ) ซึ่งจะมีข้อความอีเมลหนึ่งข้อความหลังจากที่อื่น เรารู้ได้อย่างไรว่าจุดเริ่มต้นของจุดเริ่มต้นและจุดเริ่มต้นอีกประการหนึ่งเริ่มต้นอย่างไร?

โชคดีที่อีเมลทุกฉบับมีอย่างน้อยหนึ่งบรรทัดจากจุดเริ่มต้น ข้อความทั้งหมดเริ่มต้นด้วย "จาก" (จากตามด้วยตัวอักษรช่องว่างสีขาวหรือที่เรียกว่าบรรทัด "From_") ถ้าลำดับนี้ ("จาก") ที่จุดเริ่มต้นของบรรทัดถูกนำหน้าด้วยบรรทัดว่างหรืออยู่ด้านบนสุดของไฟล์เราได้พบจุดเริ่มต้นของข้อความแล้ว

ดังนั้นสิ่งที่เรามองหาเมื่อแยกวิเคราะห์ไฟล์ mbox เป็นหลักคือบรรทัดว่างตามด้วย "จาก"

ในรูปแบบนิพจน์ปกติเราสามารถเขียนข้อความนี้ว่า "\ n \ n จากไฟล์ * \ n" เฉพาะข้อความแรกเท่านั้นที่แตกต่างกัน เริ่มจาก "จาก" ที่จุดเริ่มต้นของบรรทัด ("^ From. * \ n")

& # 34; จาก & # 34; ในร่างกาย

จะเกิดอะไรขึ้นถ้าลำดับข้อมูลด้านบนปรากฏในเนื้อหาอีเมล จะเกิดอะไรขึ้นถ้าต่อไปนี้เป็นส่วนหนึ่งของอีเมล

... ฉันส่งรายงานล่าสุดให้คุณ

จากรายงานนี้คุณไม่จำเป็นต้อง ...

ที่นี่เรามีบรรทัดว่างเปล่าตามด้วย "จาก" ที่จุดเริ่มต้นของบรรทัด หากสิ่งนี้ปรากฏในไฟล์ mbox เราจะระบุจุดเริ่มต้นของข้อความใหม่อย่างชัดเจน อย่างน้อยนั่นคือสิ่งที่นักวิเคราะห์คิดและทำไมลูกค้าอีเมลและเราจะสับสนโดย ข้อความอีเมล ที่มีทั้งผู้ส่งหรือผู้รับ แต่เริ่มต้นด้วย "From this report"

เพื่อหลีกเลี่ยงเงื่อนไขร้ายแรงดังกล่าวเราจำเป็นต้องตรวจสอบให้แน่ใจว่า "จาก" จะไม่ปรากฏที่จุดเริ่มต้นของบรรทัดต่อท้ายบรรทัดที่ว่างเปล่าในเนื้อหาอีเมล

เมื่อใดก็ตามที่เราเพิ่ม ข้อความใหม่ ลงใน ไฟล์ mbox เราจะค้นหาลำดับดังกล่าวในเนื้อหาและแทนที่ "จาก" ด้วย "> จาก" ทำให้ไม่สามารถตีความผิดได้ ตัวอย่างข้างต้นในตอนนี้มีลักษณะเช่นนี้และไม่มีการเรียกใช้ตัวแยกวิเคราะห์อีกต่อไป:

... ฉันส่งรายงานล่าสุดให้คุณ

จากรายงานนี้คุณไม่จำเป็นต้อง ...

นี่เป็นเหตุผลที่บางครั้งคุณอาจพบ "> จาก" ในอีเมลที่คุณคาดหวังว่าจะเป็นเพียง "จาก"