เทคนิคการใช้ Web search engines

แนะนำ
Search Engine เป็นซอฟแวร์ที่ช่วยค้นคว้าหาข้อมูลในอินเทอร์เน็ต และสามารถกำหนดลักษณะความต้องการในการค้นข้อมูลได้ โดยการใช้เครื่องหมายตรรกะ (Boolean Operators) เป็นเครื่องช่วยในการค้นหา

รูปแบบของ search engine ในปัจจุบันมีหลายแบบ ซึ่งอาจแบ่งออกได้เป็น 4 กลุ่ม

  • การรวบรวมรายชื่อ (directory)
  • การค้นหาด้วยโปรแกรม Web Crawlers and Spiders
  • การค้นหาข้อมูลจาก search engine อื่น (metasearching)
  • การค้นหาและรวบรวมข้อมูลเป็นกลุ่มเข้าด้วยกัน (Cluster)

การรวบรวมรายชื่อ (Directory) เว็บไซด์ที่เก็บรวบรวมคำบรรยายที่อยู่ในรูปดัชนี (index) และใช้โปรแกรมค้นหาในข้อมูลดัชนีเหล่านั้น ตัวอย่างของเว็บไซด์ที่เป็นรู้จักในช่วงที่ใช้เทคโนโลยีนี้ คือ Yahoo ซึ่งเป็น web search engine แห่งแรกที่ใช้รูปแบบการรวบรวมรายชื่อ การค้นหาด้วยโปรแกรม Web Crawlers and Spiders เว็บไซด์ที่ใช้โปรแกม web crawlers and Spiders เป็นเครื่องมือที่เข้าไปดึงเว็บเพจ และลิงค์ต่างๆที่ปรากฏในเว็บเพจเหล่านั้น มาเก็บไว้ในฐานะข้อมูลของตัวเอง บางที่ตัวโปรแกรมถูกเรียกว่า แมงมุมวิ่งไปตามเส้นใยต่างๆ ตัวอย่างของเว็บไซด์ที่ี่ใช้เทคโนโลยีนี้เป็นเจ้าแรก คือ Google ต่อจากนั้นก็มีการปรับรูปแบบตาม Google อยู่หลายเว็บไซด์ การค้นหาข้อมูลจาก search engine อื่น (metasearching) เว็บไซด์ที่ใช้โปรแกมไปค้นหาข้อมูลจากฐานข้อมูลของแหล่งอื่น เช่น Google และนำมาจัดหน้าตาให้เป็นรูปแบบของตัวเอง โดยที่ไม่มีส่วนเกี่ยวข้องกับฐานข้อมูลเหล่านั้น การค้นหาและรวบรวมข้อมูลเป็นกลุ่มเข้าด้วยกัน (Cluster) เว็บไซด์ประเภทค้นหาข้อมูลจาก search engine อื่น (metasearching) แต่โปรแกรมจะมีลักษณะพิเศษในการรวบรวมข้อมูลหลายเว็บไซด์ให้ี่เป็นกลุ่มก้อน เพื่อง่ายต่อความเข้าใจ และความเข้าถึงคำที่ค้นเหล่านั้น ว่ามีคำู่เกี่ยวข้องกับคำอื่นอย่างไรบ้าง

การใช้ตรรกะ (boolean operators)
การใช้ตรรกะ (ฺboolean operators) เป็นเครื่องมือในการค้นข้อมูลที่มีขอบเขตและแคบลงไปในเื้นื้อหาที่ต้องการ เครื่องมือนี้นิยมใช้ในการค้นคว้าที่มีเป้าหมาย และค่อนข้างที่จะรู้กลุ่มคำสำคัญ(key word)ที่จะใช้พอสมควร ส่วนการใช้ boolean operators ที่นิยมมีอยู่ 3 ตัว คือ AND ,OR และ NOT AND หมายถึง มีคำทั้งหมดในเอกสาร OR หมายถึง มีคำหนึ่งคำใดในเอกสาร
NOT หมายถึงไม่มีคำนั้นในเอกสาร

ตัวอย่างการใช้ตรรกะ สมมุติให้ A เป็นกลุ่มของเว็บไซด์ automotive และ B เป็นกลุ่มของเว็บไซด์ jobs
ตัวอย่างที่ 1. “automotive” AND “jobs” จะแสดงสีม่วงดังรูป

ตัวอย่างที่ 2. “automotive” AND “jobs” จะแสดงสีม่วงดังรูป


ตัวอย่างที่ 3. “jobs” NOT “automotive”จะแสดงสีม่วงดังรูป


 
เทคนิคการใช้ Google (ฉบับผู้เขียน)
3.1 การใช้ ” กำหนดประโยคที่ต้องการค้น วิธีนี้เหมาะกับการหาข้อมูลที่มีประโยคที่ผู้ใช้ต้องการ ตัวอย่างการใช้ เช่น

  • ช่วยตรวจไวยกรณ์ภาษาอังกฤษ บางครั้งเราอาจพิมพ์งานภาษาอังกฤษในคอมพิวเตอร์อยู่ แล้วนึกไม่ออกว่า คำบุพบท (perposition)ใดที่ถูกต้อง ผู้ใช้สามารถพิมพ์คำที่ต้องการ และดูจำนวนข้อมูลที่ปรากฏ เช่น เราไม่มั่นใจว่า divided into หรือ divided to (ที่แปลว่า แบ่งออกเป็น) ตัวไหนถูกต้อง ให้ผู้ใช้พิมพ์ “divided to และ “divided into ผลการค้นที่ี่ได้จาก google ดังนี้
    “divided into มี 130 ล้านเว็บ แต่ “devided to มี 7แสนกว่าเว็บ คำที่ถูกต้องคือ divided into
  • การคนชื่อคนหรือผู้เขียน ว่ามีเว็บไหนที่มีชื่อเว็บปรากฏ รูปแบบที่ใช้ค้นคือ “Meller D การค้นแบบนี้เหมาะสำหรับการหาผลงานที่มีอยู่ในเว็บ
  • หาเอกสารฉบับเต็ม (Full text) ที่มีอยู่ในเว็บ บางครั้งผู้ใช้อาจคนเอกสารฉบับเต็มในเว็บได้ โดยการพิมพ์ที่ต้องการในการค้นข้อมูล เช่น ต้องการหาบทความเรื่อง Liquid Piston Stirling Engine ที่อาจารย์ในภาควิชาฯเขียน ให้พิมพ์ “liquid piston stirling engine ในช่อง google search

3.2 การค้นข้อมูลเฉพาะในไซด์นั้น หรือ โดเมน (Domain) นั้น การค้นแบบนี้เหมาะกับกรหาข้อมูลเชิงลึกในไซด์ เช่น

  • ต้องการหาทราบจำนวนหน้าเว็บทั้งหมด ให้พิมพ์ site:ae.siam.edu
  • ต้องการหาเอกสารที่เป็น Portable Document Format (pdf) ในนั้น ให้พิมพ์ site:ae.siam.edu pdf
  • ต้องการหาเอกสารที่เป็นเฉพาะไซด์สถานศึกษา และเป็นเอกสาร Portable Document Format (pdf) ให้พิมพ์ site:edu pdf หรือ site:ac.th pdf