โดยทั่วไปมี 3 แบบ คือ ค้นหาในเนื้อความ (Text Search) เรียงเนื้อหาตามลำดับเวลา (Chronological) แยกตามกลุ่มประเภท (Category, Classification)
ค้นหาในเนื้อความ (Text Search)
ตัวอย่างเช่น Google ที่ก่อตั้งโดย Sergery Brin และ Larry Page ได้ออกแบบเพื่อจัดอันดับความสำคัญของเว็บโดยคำนวณจากการนับ Link จากเว็บอื่นที่ชี้มาที่เว็บหนึ่ง ๆ เป็นที่น่าติดตามว่าจะมีเทคนิควิธีในการค้นหาข้อมูลใหม่ ๆ
เรียงเนื้อหาตามลำดับเวลา (Chronological) เนื้อหาข้อมูลจะถูกจัดเก็บเรียงลำดับเวลาโดยแสดงตามเวลาใหม่ล่าสุดก่อน เช่น เว็บไซต์ประเภทข่าว อย่าง CNN, BBC และ google news เนื้อหาเก่าจะตกไปอยู่ด้านล่าง Blog ก็ใช้วิธีจัดเรียงตามเวลาเช่นกัน ทั้งนี้หากต้องการอ่านเนื้อหาเก่าก็สามารถคลิกดูที่ปฏิทินได้
แยกตามกลุ่มประเภท (Category, Classification) การจัดระเบียบแบบนี้ยึดเอาหัวข้อเป็นหลัก แล้วแยกประเภทออกไป เช่น แบ่งหนังสือเป็นประเภทธุรกิจ, หนังสือเด็ก, นวนิยาย, คอมพิวเตอร์, ศาสนา, วิทยาศาสตร์ ฯลฯ ลักษณะอื่น ๆ จะช่วยให้ค้นหาข้อมูลได้ง่ายขึ้น
ปัญหาที่เกี่ยวกับข้อมูลข่าวสารบนอินเทอร์เน็ต มีดังต่อไปนี้
- เนื้อหามีปริมาณเพิ่มขึ้นอย่างรวดเร็วรายวัน
- การค้นหาข้อมูลที่ตรงตามความต้องการมากที่สุดทำได้ยาก เนื่องจากเนื้อหาที่มีจำนวนมาก
- การค้นหาข้อมูลเฉพาะด้านที่ขึ้นกับความสนใจของผู้ทำการค้นไม่ตรงจุด
- ข้อมูลที่พบอาจจะขาดความน่าเชื่อถือ
กำเนิดปัจเจกวิธาน
Joshua Schachter เริ่มรวบรวมเก็บเว็บต่าง ๆ เป็น Bookmark ของตนเองคนเดียวไว้มากและใช้ Keyword เพื่อจัดกลุ่มแทน เช่น “search engine tools” และ “password security tools” เมื่อต้องการเรียกเว็บที่มีคำว่า tools ก็จะสามารถดึงรายชื่อเว็บทั้งหมดออกมาได้ทันทีปัจเจกวิธาน เรียก keyword นี้ว่า tag เป็นคำสัก 2 - 7 คำที่เกี่ยวกับเว็บใหม่ที่สามารถจัดเป็นกลุ่มเว็บได้
- คำว่า Folksonomy นี้ มีที่มาจากการที่ ใครก็ได้ทุก ๆ คน (Folk) มีสิทธิในการจัดทำอนุกรมวิธาน (Taxonomy) หรือ จัดกลุ่มประเภทหมวดหมู่ของเอกสารในโลกอินเทอร์เน็ตให้อยู่ในแบบที่ตนเข้าใจ
- ต่างจากการทำ Taxonomy เช่น การจัดประเภทสัตว์หรือพืช ที่อาศัย ผู้รู้ เป็นผู้ดำเนินการและให้ผู้อื่นจัดว่าอะไรควรจะอยู่ประเภทไหนตามที่ผู้รู้นั้นได้กำหนดไว้แล้ว
คุณลักษณะพิเศษ ที่ได้จากปัจเจกวิธาน
กระแสการติดตามเว็บใหม่ ๆ ตามชื่อ Tag (Stream and Feed)
การเห็นกลุ่ม Tag ก่อตัวกันมองคล้ายกลุ่มเมฆ ตามหัวเรื่องที่สนใจ (Tag Cloud)
การให้คะแนนความนิยม (Rating and Popularity)
การท่องอินเทอร์เน็ตอย่างที่มีเนื้อหาข้อมูลข้ามสายกัน (Cross-Navigation)
Networking standards
ในส่วนนี้จะกล่าวถึง Internet Standard เป็นขบวนการที่เกี่ยวข้องกับทุกๆ protocol & procedure และระเบียบแบบแผนต่างๆ ที่ใช้ในระบบอินเตอร์เน็ต ไม่จำเป็นว่ามันจะเป็นส่วนหนึ่งของ TCP/IP protocol หรือไม่ ในกรณีของหลายๆ protocol จะถูกพัฒนาและทำให้เป็นมาตราฐานด้วยองค์กรที่ไม่ใช่เป็นองค์กรของอินเตอร์เน็ต (non-Internet organizations) แต่อย่างไรก็ตาม โดยทั่วไปแล้ว the Internet Standards Process ก็จะถูกทำให้เป็น application ของ โปรโตคอลและ procedure ของ Internet context ไม่ใช่ว่าเพื่อระบุให้โปรโตคอลของมันเอง
TCP/IP
- ข้อตกลงในการควบคุมการรับส่งข้อมูล และ internet หรือ protocol ของระบบ internet Transmission Control Protocol/Internet Protocol
- โปรโตคอล TCP/IP เป็นชื่อเรียกของชุดโปรโตคอลที่สำคัญ มีการใช้งานกันอย่าง แพร่หลายตามการขยายตัวของอินเตอร์เน็ต/อินทราเน็ต ความจริงแล้วโปรโตคอลTCP/IP เป็นกลุ่มของโปรโตคอลหลายตัว ที่ประกอบกันเป็นชุดให้ใช้งาน โดยมีคำเต็มว่า Transmission Control Protocol/Internet Protocol ซึ่งจากชื่อเต็มทำให้ เราเห็นว่าอย่างน้อยก็มีโปรโตคอลประกอบกันทำงานร่วมกัน 2 โปรโตคอลคือ TCP และ IP
The HTTP protocol
HTTP เป็น network protocol ที่ใช้หลักการของ client-server model ในการติดต่อสื่อสารซึ่งหลักการทำงานอย่างคร่าว ๆ มีดังนี้
1. HTTP Client จะทำการสร้างคอนเนคชั่นไปหา HTTP Server ซึ่งโดยทั่วไปจะผ่านทาง socket ของ TCP/IP
2. หลังจากนั้น HTTP Client จะทำการส่งคำสั่ง (request) ซึ่งอยู่ในรูปของ message ไปให้ HTTP Server เพื่อทวงถามถึง resource ที่ต้องการ
3. HTTP Server จะทำการตีความคำสั่งที่ได้และส่งผล (response) ซึ่งเป็น resource ที่ HTTP Client ต้องการกลับมา (ผลที่ส่งกลับมาจะเป็นลักษณะของ message คล้ายกับ requet ของ HTTP Client ที่ส่งมาให้ HTTP Server)
4. หลังจากที่การส่ง response เสร็จสิ้น, HTTP Server จะทำการปิดคอนเนคชั่นที่มาจาก HTTP Client
5. ในกรณีที่ HTTP Client ต้องการ resource อื่น ๆ, HTTP Client จะต้องทำการสร้างคอนเนคชั่นใหม่และส่งคำสั่งไปหา HTTP Server อีกครั้ง
จากหลักการข้างต้นจะเห็นว่าการติดต่อสื่อสารระหว่าง Client และ Server จะเป็นลักษณะครั้งต่อครั้ง ในทาง network เราเรียกการติดต่อสื่อสารแบบนี้ว่า Stateless Protocol
1. HTTP Client จะทำการสร้างคอนเนคชั่นไปหา HTTP Server ซึ่งโดยทั่วไปจะผ่านทาง socket ของ TCP/IP
2. หลังจากนั้น HTTP Client จะทำการส่งคำสั่ง (request) ซึ่งอยู่ในรูปของ message ไปให้ HTTP Server เพื่อทวงถามถึง resource ที่ต้องการ
3. HTTP Server จะทำการตีความคำสั่งที่ได้และส่งผล (response) ซึ่งเป็น resource ที่ HTTP Client ต้องการกลับมา (ผลที่ส่งกลับมาจะเป็นลักษณะของ message คล้ายกับ requet ของ HTTP Client ที่ส่งมาให้ HTTP Server)
4. หลังจากที่การส่ง response เสร็จสิ้น, HTTP Server จะทำการปิดคอนเนคชั่นที่มาจาก HTTP Client
5. ในกรณีที่ HTTP Client ต้องการ resource อื่น ๆ, HTTP Client จะต้องทำการสร้างคอนเนคชั่นใหม่และส่งคำสั่งไปหา HTTP Server อีกครั้ง
จากหลักการข้างต้นจะเห็นว่าการติดต่อสื่อสารระหว่าง Client และ Server จะเป็นลักษณะครั้งต่อครั้ง ในทาง network เราเรียกการติดต่อสื่อสารแบบนี้ว่า Stateless Protocol
Domain names
คือ ชื่อเว็บไซต์ (www.yourdomain.com) ที่สามารถเป็นเจ้าของ ซึ่งจะต้องไม่ซ้ำกับคนอื่น เพื่อการเรียกหาเว็บไซต์ที่ต้องการ “ชื่อเว็บไซต์” คือ สิ่งแรกที่แสดง หรือ ประกาศความมีตัวตนบนอินเตอร์เน็ตให้คนทั่วไปได้รู้จัก สามารถมีได้ชื่อเดียวในโลกเท่านั้น เช่น www.gict.co.th เมื่อผู้ใช้กรอกชื่อลงไปในช่อง Address ของ Internet Explorer ก็จะส่งชื่อไปร้องถามจากเครื่องแปลชื่อโดเมน (Domain Name Server) และได้รับกลับมาเป็นไอพีแอดเดรส (Internet Protocol) แล้วส่งคำร้องไปให้กับเครื่องปลายทางตามไอพีแอดเดรส และได้ข้อมูลกลับมาตามรูปแบบที่ร้องขอไป
ข้อควรรู้ก่อนจดโดเมน
- ความยาวของชื่อ Domain ตั้งได้ไม่เกิน 63 ตัวอักษร
- Domain ต้องจดในชื่อของเราเท่านั้น Domain Ownership
- ถ้าเป็น Domain ของบริษัท พยายามจดภายใต้ชื่อบริษัท อย่าจดด้วยชื่อพนักงาน IT
- ข้อมูลที่สำคัญที่สุดของ Domain คือ Owner Detail
- ใช้อีเมล์ที่จะอยู่กับเราตลอดไปในการจดโดเมน ซึ่งเป็นสิ่งเดียวที่ใช้ติดต่อกับเราเรียกว่า Registrant E-mail
- บันทึกข้อมูลเกี่ยวกับ Domain ของเราไว้ให้ดี วันหมดอายุ ผู้ติดต่อ และอื่น ๆ