วิธีการใช้เครื่องมือ 'Ngram Viewer' ใน Google หนังสือ

Ngram หรือที่เรียกกันทั่วไปว่า N-gram คือการวิเคราะห์เนื้อหาข้อความหรือการพูดเพื่อหา n (จำนวน) ของรายการในข้อความ อาจเป็นได้หลายประเภทเช่น phonemes คำนำหน้าวลีหรือตัวอักษร แม้ว่า N-gram ค่อนข้างคลุมเครือด้านนอกของนักวิจัย แต่ก็มีการนำมาใช้งานจริงในหลายสาขาวิชาและมีผลกระทบมากมายสำหรับผู้ที่ทำให้โปรแกรมคอมพิวเตอร์เข้าใจและตอบสนองกับภาษาพูดที่เป็นธรรมชาติ สั้น ๆ ว่า Google จะสนใจในแนวคิดนี้

ในกรณีของ Google Books Ngram Viewer ข้อความที่จะวิเคราะห์มาจากหนังสือ Google จำนวนมากที่ได้รับการสแกนจากห้องสมุดสาธารณะเพื่อใส่เครื่องมือค้นหา Google หนังสือ สำหรับ Google Books Ngram Viewer พวกเขาอ้างถึงข้อความที่คุณกำลังจะค้นหาในชื่อ "corpus" ร่างกายใน Ngram Viewer แบ่งออกเป็นภาษาแม้ว่าคุณจะสามารถวิเคราะห์อังกฤษและอเมริกันอังกฤษแยกกันได้ แต่เพียงผู้เดียว มันจบลงด้วยการเป็นซูเปอร์ที่น่าสนใจในการสลับจากการใช้คำศัพท์ของอังกฤษไปอเมริกาและดูแผนภูมิเปลี่ยนไป

วิธีการทำงานของ Ngram

  1. ไปที่ Google Books Ngram Viewer ที่ books.google.com/ngrams
  2. รายการต่างๆแยกตามตัวพิมพ์เล็กและตัวอักษรไม่เหมือนการค้นหาของ Google Web ดังนั้นอย่าลืมพิมพ์คำนามที่เหมาะสม
  3. พิมพ์วลีหรือวลีที่คุณต้องการวิเคราะห์ อย่าลืมแยกแต่ละวลีด้วยจุลภาค Google แนะนำ "Albert Einstein, Sherlock Holmes, Frankenstein" เพื่อให้คุณเริ่มต้น
  4. ถัดไปพิมพ์ช่วงวันที่ ค่าเริ่มต้นคือ 1800 ถึง 2000 แต่มีหนังสือล่าสุด (ปี 2011 เป็นรายการล่าสุดในเอกสารของ Google แต่อาจมีการเปลี่ยนแปลง)
  5. เลือกคลังข้อมูล คุณสามารถค้นหาข้อความภาษาต่างประเทศหรือภาษาอังกฤษและนอกเหนือจากทางเลือกมาตรฐานแล้วคุณอาจสังเกตเห็นสิ่งต่างๆเช่น "English (2009) or American English (2009)" ที่ด้านล่าง นี่เป็นข้อมูลเก่าที่ Google ได้อัปเดตมาตั้งแต่ต้น แต่คุณอาจมีเหตุผลบางอย่างที่จะทำการเปรียบเทียบกับชุดข้อมูลเก่า ผู้ใช้ส่วนใหญ่สามารถละเว้นพวกเขาและเน้นที่ corpora ล่าสุด
  6. ตั้งระดับความเรียบของคุณ Smoothing หมายถึงความเรียบของกราฟในตอนท้าย การแสดงที่ถูกต้องที่สุดจะเป็นระดับที่ราบเรียบเป็น 0 แต่อาจเป็นเรื่องยากที่จะอ่าน ค่าเริ่มต้นถูกตั้งไว้ที่ 3. ในกรณีส่วนใหญ่คุณไม่จำเป็นต้องปรับค่านี้
  1. กดปุ่ม ค้นหาหนังสือจำนวนมาก (นอกจากนี้คุณยังสามารถกดเพียงป้อนที่ช่องค้นหา)

Ng คืออะไรแสดง?

Google Books Ngram Viewer จะแสดงกราฟที่แสดงถึงการใช้วลีเฉพาะในหนังสือผ่านช่วงเวลา หากคุณป้อนมากกว่าหนึ่งคำหรือวลีคุณจะเห็นบรรทัดที่มีรหัสสีเพื่อเปรียบเทียบคำค้นหาที่ต่างกัน นี่ดูคล้ายกับ Google Trends โดยเฉพาะการค้นหาครอบคลุมระยะเวลานานเท่านั้น

นี่เป็นตัวอย่างชีวิตจริงเราอยากรู้เกี่ยวกับพายน้ำส้มสายชูเมื่อเร็ว ๆ นี้ พวกเขาได้รับการกล่าวถึงใน Little House ลอร่า Ingalls Wilder ใน ชุด Prairie แต่เราไม่เคยได้ยินเรื่องแบบนั้นมาก่อน ก่อนอื่นเราได้ใช้ การค้นหาเว็บของ Google เพื่อเรียนรู้เพิ่มเติมเกี่ยวกับพริกเผ็ด เห็นได้ชัดว่าพวกเขาถือว่าเป็นส่วนหนึ่งของอาหารอเมริกันตอนใต้และจริงๆทำมาจากน้ำส้มสายชู พวกเขาได้ยินกลับมาถึงช่วงเวลาที่ทุกคนไม่ได้เข้าถึงวัตถุดิบสดใหม่ตลอดเวลาของปี เป็นเรื่องทั้งหมดหรือไม่?

เราค้นหา Google Ngram Viewer และมีบางส่วนกล่าวถึงพายทั้งในตอนต้นและปลายปี 1800 ซึ่งมีการกล่าวถึงในทศวรรษที่ 1940 เป็นจำนวนมากและมีการพูดถึงในหลาย ๆ ครั้งที่ผ่านมา (บางทีความคิดถึงเรื่องวงกลมบางอย่าง) ดีมีบางอย่าง ปัญหาเกี่ยวกับข้อมูลที่ระดับราบเรียบ 3. มีที่ราบสูงที่กล่าวถึงในปี ค.ศ. 1800 แน่นอนว่าไม่มีการกล่าวถึงพายโดยเฉพาะอย่างยิ่งในแต่ละปีเป็นเวลา 5 ปี? สิ่งที่เกิดขึ้นคือเนื่องจากไม่มีหนังสือที่เผยแพร่ในช่วงเวลานั้นมากและเนื่องจากข้อมูลของเรามีการตั้งค่าให้เรียบจะบิดเบือนภาพ อาจมีหนังสือเล่มหนึ่งที่กล่าวถึงพายน้ำส้มสายชูและมีค่าเฉลี่ยเพื่อหลีกเลี่ยงการขัดขวาง เมื่อตั้งค่าการทำให้ราบเรียบเป็น 0 เราจะเห็นได้ว่าเป็นกรณีเดียวกัน ศูนย์การขัดขวางเมื่อปีพ. ศ. 2412 และมีการขัดขวางอีกครั้งในปีพ. ศ. 2440 และ 2443

ไม่มีใครพูดถึงน้ำส้มสายชูพายตลอดเวลา? พวกเขาอาจพูดเกี่ยวกับพายเหล่านั้น สูตร มีแนวโน้มที่จะลอยอยู่ทั่วทุกแห่ง พวกเขาไม่ได้ เขียน เกี่ยวกับพวกเขาในหนังสือและนี่เป็นข้อ จำกัด ของการค้นหา Ngram เหล่านี้

การค้นหาขั้นสูงของ Ngram

โปรดจำไว้ว่าเราได้กล่าวว่า Ngrams สามารถประกอบด้วยการค้นหาข้อความต่างๆได้ทุกประเภทหรือไม่? Google ช่วยให้คุณสามารถเจาะลึกได้มากขึ้นด้วย Ngram Viewer ด้วย หากคุณต้องการค้นหาปลาคำกริยาแทนคำนามปลาคุณสามารถทำได้โดยการใช้แท็ก ในกรณีนี้คุณต้องการค้นหา "fish_VERB"

Google มีรายการคำสั่งทั้งหมดที่คุณสามารถใช้และเอกสารขั้นสูงอื่น ๆ ในเว็บไซต์ของตนได้