เทคนิคการประมวลผลภาษาธรรมชาติสำหรับการตลาดเนื้อหา

เผยแพร่แล้ว: 2019-10-18

การประมวลผลภาษาธรรมชาติ (NLP) และปัญญาประดิษฐ์ (AI) ได้กลายเป็นส่วนสำคัญในการรวบรวม วิเคราะห์ และถ่ายทอดข้อมูล สิ่งเหล่านี้เป็นส่วนสำคัญของโลกอัจฉริยะของเรา ตั้งแต่หน้าแรกของ Google ไปจนถึงการแนะนำอัตโนมัติไปจนถึงตัวกรองอีเมล

และพวกเขากำลังกลายเป็นกำลังที่ไม่อาจปฏิเสธได้ในการทำการตลาดเนื้อหาด้วย หกปีแล้วที่ Google เปิดตัวอัลกอริธึม Hummingbird; การสร้างเนื้อหาเน้นที่ความตั้งใจของผู้ใช้มากกว่าและไม่เกี่ยวกับ SEO

ครั้งหนึ่งเคยใช้สำหรับการศึกษาภาษาศาสตร์และการแปลเท่านั้น ตอนนี้ NLP มีบทบาทสำคัญในประเภทเนื้อหาที่เราสร้างและวิธีที่เราสร้าง

มีชิ้นส่วนที่เคลื่อนไหวจำนวนมากสำหรับ NLP ทุกหัวข้อหรือทุกส่วนของข้อความที่วิเคราะห์ต้องผ่านกระบวนการแยกวิเคราะห์ ทำความเข้าใจ วิเคราะห์ และจัดทำเป็นชุดเดียวกัน

ส่วนใหญ่เป็นเทคนิคและเน้นนักพัฒนา ดังนั้นเราจึงคิดว่าเราจะแบ่งขั้นตอนพื้นฐานของการประมวลผลภาษาธรรมชาติเป็นสิ่งที่เข้าถึงได้ง่ายขึ้นเล็กน้อย และนำไปใช้กับกลยุทธ์การตลาดเนื้อหา

ต่อไปนี้คือสี่ขั้นตอนพื้นฐานของ NLP และวิธีการทำงานในระดับสูง

การวิเคราะห์คำศัพท์และวากยสัมพันธ์

เมื่ออัลกอริธึมวิเคราะห์ข้อความ จะเริ่มโดยการแยก (แยกวิเคราะห์) ประโยคหรือข้อความออกเป็นหน่วยไวยากรณ์ เมื่อถึงจุดนั้น หน่วยจะถูกแปลงเป็นโทเค็นหรือบิตข้อมูลที่คอมพิวเตอร์สามารถอ่านได้

จากนั้นจึงใช้โทเค็นเหล่านั้นและพยายามตรวจสอบว่าข้อความนั้นสมเหตุสมผลหรือไม่ โดยพิจารณาจากโครงสร้างทางไวยากรณ์ นั่นคือการวิเคราะห์วากยสัมพันธ์

หากโครงสร้างไม่ถูกต้อง จะไม่สามารถให้ความหมายเชิงตรรกะแก่เนื้อหาได้ หากเป็นเช่นนั้น อัลกอริธึมจะวิเคราะห์ความหมายตามตัวอักษรของข้อความ

แน่นอน ภาษาและโครงสร้างของมนุษย์ไม่ได้แห้งแล้งเสมอไป คุณยังต้องพิจารณาถึงการเสียดสี การเล่นคำ หรือไวยากรณ์ที่ไม่สมบูรณ์ที่เลียนแบบรูปแบบคำพูดที่เป็นธรรมชาติ

นั่นคือที่มาของการวิเคราะห์เชิงความหมาย ซึ่งเราจะพูดถึงในอีกสักครู่

การวิเคราะห์วากยสัมพันธ์เป็นองค์ประกอบหนึ่งของการประมวลผลภาษาธรรมชาติ และช่วยให้อัลกอริธึมและแอปทำงานต่างๆ เช่น การวิเคราะห์ข้อความและการแปลภาษา

การวิเคราะห์เชิงความหมาย

การวิเคราะห์เชิงความหมายเป็นวิธีที่ซับซ้อนกว่าในการทำความเข้าใจความหมายเบื้องหลังข้อความ นี่คือที่มาของโครงข่ายประสาทเทียม

โครงข่ายประสาทเทียมประมวลผลข้อมูลในลักษณะที่เลียนแบบสมองของมนุษย์ ผู้ประมวลผลข้อมูลขนาดใหญ่เหล่านี้เรียนรู้ภาษาได้มากเหมือนที่เราทำ โดยจะวิเคราะห์ข้อความและเปรียบเทียบกับรูปแบบภาษามนุษย์อื่นๆ เพื่อค้นหาความหมายที่แท้จริง จากนั้นจะจัดกลุ่มส่วนของข้อความไว้ด้วยกัน แม้ว่าจะไม่ได้เกี่ยวข้องกันมากนักบนพื้นผิวก็ตาม

นับตั้งแต่ Google เปิดตัว Hummingbird ในปี 2013 เป็นที่ชัดเจนว่าเสิร์ชเอ็นจิ้นใช้การวิเคราะห์เชิงความหมาย

อันที่จริง Neil Patel ร่วมมือกับ MarketMuse เพื่อศึกษาอัลกอริธึมโดยจัดระเบียบคำศัพท์หลายล้านคำออกเป็นคลัสเตอร์หัวข้อและเปรียบเทียบกับอันดับ 31.5 ล้านหน้า พวกเขาพบว่าหน้าเว็บที่ครอบคลุมหัวข้อที่แคบมากทำได้ดีในการจัดอันดับ SERP

เนื่องจากผู้ใช้กำลังมองหาข้อมูลที่มีค่าและเจาะลึกซึ่งตอบคำค้นหาเฉพาะของตน Google จึงทำงานอย่างหนักเพื่อจัดอันดับหน้าเว็บประเภทดังกล่าวเป็นอันดับแรก ใช้การวิเคราะห์เชิงความหมายเพื่อทำความเข้าใจความสัมพันธ์ระหว่างหัวข้อต่างๆ เช่น การดูแลสวนในฤดูใบไม้ผลิ และการ คลุมดิน

โดยจะค้นหาเนื้อหาที่ครอบคลุมหัวข้อที่เกี่ยวข้องทั้งหมด ไม่ว่าจะเป็นส่วนเดียวหรือผ่านการจัดกลุ่มหัวข้อ และจัดอันดับเนื้อหานั้นก่อน

การสร้างแบบจำลองหัวข้อ

การสร้างแบบจำลองหัวข้อหมายถึงกระบวนการของการวิเคราะห์ข้อมูลที่ไม่มีโครงสร้างและการรวมกลุ่มคำและวลีที่เกี่ยวข้องเข้าด้วยกัน โดยพื้นฐานแล้ว การวิเคราะห์เชิงความหมายต้องใช้อีกขั้นหนึ่ง

เมื่ออัลกอริทึมเข้าใจความหมายและความสัมพันธ์เบื้องหลังคำและวลีแล้ว จะจัดกลุ่มเป็นกลุ่มที่เกี่ยวข้องกัน กระบวนการนั้นเรียกว่า Latent Dirichlet Allocation (LDA)

นักการตลาดเนื้อหาสามารถใช้คลัสเตอร์เหล่านั้นเพื่อแมปแผนเนื้อหาและสร้างคลัสเตอร์หัวข้อที่มีประสิทธิภาพมากขึ้นเพื่อการจัดอันดับที่ดีขึ้น

มาดูตัวอย่างกัน สมมติว่าคุณเป็นหอการค้าในรัฐเวอร์มอนต์และต้องการดึงดูดผู้ใช้มายังไซต์ของคุณและนักท่องเที่ยวมายังรัฐของคุณในช่วงฤดูใบไม้ร่วง คุณใช้อัลกอริทึมการสร้างแบบจำลองหัวข้อเพื่อแมปเนื้อหาที่เกี่ยวข้องกับใบไม้ร่วง

ใบไม้ร่วงในรัฐเวอร์มอนต์ จึงกลายเป็นเสาหลักของคุณ จากนั้นอัลกอริธึมจะให้หัวข้อที่เกี่ยวข้องแก่คุณ เช่น การขับรถในฤดูใบไม้ร่วง แผนที่ใบไม้ สาเหตุที่ใบไม้เปลี่ยนสี หรือ เทศกาลฤดูใบไม้ร่วงในรัฐเวอร์มอนต์

โดยพื้นฐานแล้ว เป็นการนำเอาการคาดเดาออกจากการวางแผนเนื้อหา

ผู้เชี่ยวชาญค่อนข้างมั่นใจว่าเสิร์ชเอ็นจิ้นเช่น Google และ Bing ใช้อัลกอริทึมการสร้างแบบจำลองหัวข้อเพื่อค้นหาและจัดอันดับหน้า

ฉันพูด ค่อนข้างมั่นใจ เพราะเสิร์ชเอ็นจิ้นไม่ชอบบอกเราว่าพวกเขาจัดอันดับหน้าเว็บอย่างไร ถ้าเป็นเช่นนั้น มันจะค่อนข้างง่ายในการเล่นเกมระบบ

นักการตลาดยังสามารถใช้แบบจำลองหัวข้อสามารถเริ่มต้นด้วยคำหลักและดึงหัวข้อที่เกี่ยวข้อง หัวข้อย่อย และคำหลักอื่นสำหรับแต่ละชิ้น

กำลังมองหาแอปพลิเคชันในโลกแห่งความเป็นจริง? MarketMuse ใช้การวิเคราะห์เชิงความหมายและการสร้างแบบจำลองหัวข้อเพื่อสร้างบทสรุปที่ครอบคลุมทุกสิ่งที่ฉันได้พูดถึงที่นี่ คุณสามารถเรียกใช้การวิเคราะห์และมอบหมายงานที่ครอบคลุมให้กับนักเขียนของคุณ

การรับรู้เอนทิตีที่มีชื่อ (NER)

นี่เป็นวิธีที่ยอดเยี่ยมในการแท็กเนื้อหาสำหรับองค์กร การค้นพบเนื้อหา และ SEO Named Entity Recognition จะสแกนเนื้อหาเพื่อค้นหาคำที่ตรงกับหมวดหมู่ที่กำหนดไว้ล่วงหน้า เช่น คน สถานที่ และสิ่งของ

จากการจัดกลุ่มเหล่านี้ คุณสามารถสร้างแท็กที่จะช่วยคุณค้นหาเนื้อหาของคุณเอง ช่วยให้คุณสามารถแนะนำบทความที่เกี่ยวข้องให้กับผู้ใช้ และปรับปรุงข้อมูลเมตาของคุณสำหรับเครื่องมือค้นหา

ลองนึกภาพคุณมีไลบรารีเนื้อหามากมายในไซต์ของคุณ ทันใดนั้น หัวข้อหนึ่งเริ่มมีแนวโน้มในโซเชียลมีเดีย อาจเป็นตามฤดูกาล เช่น วันฮาโลวีน หรืออาจเป็นสีฟ้า เช่น การตายของคนดัง

หากคุณเคยใช้ NER ในการแท็กเนื้อหาของคุณและกรอกข้อมูลเมตาของคุณ การค้นหาเนื้อหาที่เกี่ยวข้องที่คุณมีในหัวข้อนั้นควรเป็นเรื่องง่าย อัปเดตและเผยแพร่ซ้ำเพื่อให้เป็นไปตามกระแสของเทรนด์นั้น

นอกจากนี้ยังช่วยให้แชทบอทเข้าใจคำถามและดึงข้อมูลที่ถูกต้องสำหรับผู้ใช้ แชทบอทจะดูคำที่ได้รับ จัดหมวดหมู่ แล้วดึงคำตอบที่เกี่ยวข้องจากหมวดหมู่เดียวกัน

สรุป

นับตั้งแต่ Google เปลี่ยนโฟกัสไปที่ความตั้งใจของผู้ใช้ นักการตลาดเนื้อหาได้พยายามหาวิธีสร้างเนื้อหาที่มีประสิทธิภาพและมีค่าที่สุดสำหรับผู้ใช้และสำหรับการค้นหา NLP และ AI ช่วยให้เราสามารถศึกษาเนื้อหาได้จากทุกมุม

การใช้ AI เพื่อแจ้งและดำเนินการแผนเนื้อหาของคุณไม่ใช่ทางเลือกอีกต่อไป มันเป็นเพียงอนาคต แต่ลองนึกถึงเนื้อหาที่น่าตื่นเต้นทั้งหมดที่คุณนำเสนอ เนื้อหาที่คุณอาจไม่เคยรู้จักมาก่อนสามารถช่วยดึงดูดและรักษาผู้ใช้ไว้ได้