แท็ก Meta Charset ใน HTML5

การตั้งค่าการเข้ารหัสอักขระใน HTML5

ก่อนที่จะมีการแนะนำ HTML5 การตั้งค่าการเข้ารหัสอักขระบนเอกสารที่มี elementrequiredyou เพื่อเขียนบรรทัด verbose ค่อนข้างชัดเจนด้านล่าง นี่คือองค์ประกอบ Meta Charset หากคุณใช้ HTML4 ในหน้าเว็บของคุณ:

สิ่งสำคัญที่ควรสังเกตในโควต้านี้คือเครื่องหมายคำพูดที่คุณเห็นในส่วน เนื้อหาเนื้อหา : content = " text / html; charset = iso-8859-1 " เช่นเดียวกับคุณลักษณะ HTML ทั้งหมดอัญประกาศเหล่านี้จะกำหนดค่าของแอตทริบิวต์ซึ่งระบุว่า ข้อความ สตริงทั้ง / html; charset = iso-8959-1 เป็น เนื้อหา ขององค์ประกอบนี้นี่เป็น HTML ที่เหมาะสมและเป็นข้อความที่ว่านี้ควรมีการเขียนขึ้น นอกจากนี้ยังเป็นเทอะทะยาวและน่าเกลียด! นอกจากนี้ยังไม่ใช่สิ่งที่คุณอาจจะจำได้จากด้านบนศีรษะของคุณ! ในกรณีส่วนใหญ่นักพัฒนาเว็บจะต้องคัดลอกและวางโค้ดนี้จากไซต์หนึ่งไปเป็นไซต์ใหม่ที่พวกเขาพัฒนาขึ้นเนื่องจากการเขียนข้อความนี้ตั้งแต่เริ่มต้นก็ขอให้มาก

HTML5 ตัดข้อมูล Extra & # 34; Stuff & # 34;

HTML5 ไม่เพียง แต่ เพิ่มองค์ประกอบใหม่ ๆ ลงในภาษา แต่ยังช่วยในการจัดรูปแบบไวยากรณ์ของ HTML ได้ง่ายรวมถึงองค์ประกอบของ Meta Charset ด้วย HTML5 คุณสามารถเพิ่มการเข้ารหัสอักขระของคุณด้วยการจำ syntaxfor สำหรับองค์ประกอบ META ที่ง่ายกว่า คุณเห็นด้านล่าง:

เปรียบเทียบไวยากรณ์ที่เรียบง่ายกับสิ่งที่เราเขียนไว้ในตอนต้นของบทความนี้ไวยากรณ์เก่าที่ใช้สำหรับ HTML4 และคุณจะเห็นได้ว่าเขียนและจำ HTML5 ได้ง่ายแค่ไหน แทนที่จะต้องคัดลอกและวางข้อมูลจากไซต์ที่มีอยู่ลงในไซต์ใหม่ที่คุณกำลังทำงานอยู่นี่เป็นสิ่งที่สำคัญอย่างยิ่งเนื่องจากในฐานะนักพัฒนาเว็บแบบหน้าเว็บคุณสามารถจำได้ การประหยัดเวลานี้ไม่มากนัก แต่เมื่อคุณพิจารณาพื้นที่ไวยากรณ์อื่น ๆ ที่ HTML5 ใช้งานง่ายการประหยัดจะเพิ่มขึ้น!

เสมอรวมถึงการเข้ารหัสตัวอักษร

คุณควรรวมการเข้ารหัสอักขระสำหรับหน้าเว็บของคุณเสมอแม้ว่าคุณจะไม่ได้ใช้ อักขระพิเศษ ก็ตาม หากคุณไม่ได้มีการเข้ารหัสอักขระเว็บไซต์ของคุณจะเสี่ยงต่อการโจมตีสคริปต์แบบ cross site โดยใช้ UTF-7

ในสถานการณ์สมมตินี้ผู้โจมตีเห็นว่าไซต์ของคุณไม่มีการเข้ารหัสอักขระที่กำหนดไว้ดังนั้นจึงทำให้เบราว์เซอร์คิดว่าการเข้ารหัสอักขระของหน้านี้เป็นจริงเป็น UTF-7 จากนั้นผู้โจมตีจะใส่สคริปต์ที่เข้ารหัส UTF-7 ลงในหน้าเว็บและไซต์ของคุณจะถูกแฮ็กโดยปัญหานี้เป็นปัญหาสำหรับทุกคนที่เกี่ยวข้องจาก บริษัท ของคุณต่อผู้เยี่ยมชม ข่าวดีก็คือว่ามันเป็นปัญหาง่ายๆในการหลีกเลี่ยง - เพียง แต่ต้องแน่ใจว่าได้เพิ่มการเข้ารหัสอักขระลงในทุกหน้าเว็บของคุณ

ตำแหน่งที่จะเพิ่มการเข้ารหัสอักขระ

การเข้ารหัสอักขระสำหรับเว็บเพจควรเป็นบรรทัดแรกขององค์ประกอบ ของ HTML ซึ่งจะช่วยให้แน่ใจได้ว่าเบราว์เซอร์รู้ว่าการเข้ารหัสอักขระคืออะไรก่อนที่จะทำอะไรอื่นในหน้าเว็บอื่นนอกเหนือจากการกำหนด doctype และระบุว่าเป็น หน้า HTML HTML ของคุณควรอ่าน:

...

ใช้ส่วนหัว HTTP เพื่อความปลอดภัยพิเศษ

นอกจากนี้คุณยังสามารถระบุการเข้ารหัสอักขระในส่วนหัว HTTP นี่เป็นความปลอดภัยมากกว่าการเพิ่มลงในหน้า HTML แต่คุณต้องการเข้าถึงการกำหนดค่าเซิร์ฟเวอร์หรือไฟล์. htaccess ซึ่งหมายความว่าคุณอาจต้องทำงานร่วมกับ ผู้ให้บริการโฮสติ้งของเว็บไซต์ เพื่อให้ได้รับการเข้าถึงแบบนี้หรือทำให้พวกเขาทำ การเปลี่ยนแปลงของคุณ Access เป็นสิ่งท้าทายที่นี่ การเปลี่ยนแปลงตัวเองเป็นเรื่องง่ายดังนั้นผู้ให้บริการโฮสต์ใด ๆ ควรสามารถทำการเปลี่ยนแปลงนี้เพื่อความสะดวกของคุณได้อย่างคล่องตัว

หากคุณใช้แอ็พพลิเคชันคุณสามารถตั้งค่าชุดอักขระเริ่มต้นสำหรับทั้งไซต์โดยการเพิ่ม: AddDefaultCharset UTF-8 ลงในไฟล์. htaccess ของราก ชุดอักขระเริ่มต้นของ Apache คือ ISO-8859-1