Meresci

Giáo trình điện tử
Phương pháp nghiên cứu tài liệu
trong nghiên cứu khoa học

ULP

MỤC LỤC

MeresciPhương pháp tìm kiếm tài liệu tham khảo khoa học > Tìm kiếm và chọn lọc kết quả > Khai thác tối đa các tính năng của công cụ tìm kiếm
Giới thiệu giáo trình

Tác giả

Kiểm tra đầu vào

Phần 1. Các bước triển khai một đề tài nghiên cứu khoa học

Phần 2. Phương pháp tìm kiếm tài liệu tham khảo khoa học

Phần 3. Khai thác thông tin từ tài liệu khoa học

Phần 4. Phương pháp viết tài liệu khoa học

Phần 5. Kĩ thuật soạn thảo tài liệu khoa học 

Kiểm tra đầu ra

Phản hồi kết quả

Thư mục

Phần 2. Phương pháp tìm kiếm tài liệu tham khảo khoa học



Tìm kiếm và chọn lọc kết quả

Khai thác tối đa các tính năng của công cụ tìm kiếm

Mỗi một công cụ tìm kiếm thường cung cấp một số những chức năng tìm kiếm khác nhau, có thể rất hữu ích giúp người dùng xác định các công thức tìm kiếm tinh tế hơn.

Với một bộ máy tìm kiếm, lượng kết quả cung cấp cho mỗi lượt tìm kiếm bình thường luôn... quá ấn tượng, đến mức không thể hoặc rất khó phân biệt được thứ gì hay, dở, cần hay không cần, phù hợp hay không phù hợp trong số kết quả vàng thau lẫn lộn đó.

Dưới đây là phần mô tả một số tính năng nâng cao cơ bản của các công cụ tìm kiếm phổ biến, thực sự hiệu quả để lọc thông tin:

Nhan đề trang

Nếu một trang web được thiết kế đúng theo quy tắc trình bày, nhan đề trang sẽ phản ánh toàn bộ nội dung cơ bản của trang đó. Và các nguồn cung cấp thông tin nghiêm túc thông thường sẽ tuân thủ rất tốt quy tắc này.

Do đó, nếu lập công thức tìm kiếm một từ có trong nhan đề trang, xác suất có được những tài liệu có nội dung chính phù hợp với chủ đề cần tìm là rất cao, và sẽ loại bỏ hết những trang nào nói về các chủ đề khác nhưng có một chỗ nào đó nhắc đến từ đang cần tìm.

Có hai cách lập công thức tìm trong nhan đề trang:

  • Dùng hàm đi kèm với từ cần tìm: 
    • Khi tìm một từ trong nhan đề trang, hàm này giống nhau ở nhiều bộ máy tìm kiếm phổ thông như Google, Yahoo! và Exalead: "intitle:từcầntìm" (không có khoảng trắng trước và sau dấu hai chấm).
    • Khi tìm nhiều từ trong nhan đề trang: ở Google là "allintitle:từ1 từ2 từ3..." (không có khoảng trắng giữa hàm và từ cần tìm đầu tiên, các từ cần tìm còn lại cách nhau một khoảng trắng).
  • Nhấn nút "Tìm kiếm nâng cao" (advanced search/recherche avancée): cách này đơn giản hơn, không phải nhọc công nhớ các hàm tìm kiếm phức tạp. Chỉ cần nhấn nút và điền các từ tìm kiếm vào các ô đã thiết kế sẵn và có chú thích công dụng rõ ràng.
    • Một cố công cụ không dùng cùng thuật ngữ mà có thể gọi là "Tìm kiếm với nhiều chi tiết", "Tìm kiếm chuyên gia" (expert search/recherche expert).
Về đầu trang
Tên miền, địa chỉ mạng

Thông qua tên miền (domain name/domaine) và địa chỉ mạng, các bộ máy tìm kiếm có thể giới hạn phạm vi tìm kiếm ở mức độ cao hơn, chọn lọc thông tin từ những nguồn được xác định qua các công thức tìm kiếm có sử dụng tính năng này.

Những tên miền có đuôi .edu, .ac thường được dành riêng cho các trường đại học, .gov, .gouv dành riêng cho các cơ quan nhà nước,... thường là những nguồn thông tin chính thống, có độ tin cậy cao.

Các tổ chức lớn thường dùng tên miền có đuôi .org, các nguồn chuyên về cung cấp thông tin thường dùng .info,... cũng là những nguồn cung cấp thông tin có giá trị. Tuy nhiên, vẫn có một số trường hợp các tên miền này bị lạm dụng không đúng chức năng, nên người dùng phải tỉnh táo để phân biệt được.

Nói chung, có những quy tắc cơ bản trong việc quản lí sử dụng tên miền ở cấp độ quốc tế và cấp độ của từng quốc gia. Nhưng vẫn có sự khác biệt nhỏ trong từng phạm vi hẹp. Khi đã làm quen dần với Internet, người dùng sẽ có kinh nghiệm để hiểu biết rõ hơn các đặc điểm quản lí tên miền ở từng cấp độ, giúp nhanh chóng nhận diện được những nguồn thông tin có giá trị trên Mạng.

Nếu dùng hàm, với các bộ máy tìm kiếm phổ thông, đó là hàm: "site:tênmiềnđầyđủ". 

  • Ví dụ: "site:ctu.edu.vn" là hàm chỉ tìm thông tin từ website của Trường Đại học Cần Thơ (Việt Nam), hoặc "site:edu.vn" cho thông tin từ các trường đại học ở Việt Nam, hoặc "site:edu" cho thông tin từ các trường đại học Hoa Kì.

Cách đơn giản nhất vẫn là sử dụng các chức năng tìm kiếm nâng cao, với các ô thiết kế sẵn để điền thông tin vào, thay vì phải học thuộc lòng các hàm tìm kiếm phức tạp.

Về đầu trang
Định dạng tập tin

Các trang web thường được thiết kế bằng ngôn ngữ định dạng siêu văn bản (HTML). Ngoài ra có một số định dạng tập tin khác cũng được sử dụng phổ biến để cung cấp, trao đổi thông tin trên Internet (.DOC, .PDF, .PPT, .WAV, .MP3, .PS, .SWF, .RTF, v.v.). Các bộ máy tìm kiếm phổ thông như Google, Yahoo!, Exalead,... thường tìm kiếm mặc định trên tất cả các định dạng tập tin. Và đó cũng là một cách để làm... tăng độ "nhiễu thông tin" trong kết quả tìm kiếm (?!).

Đối với các tài liệu khoa học và giảng dạy, hai định dạng được sử dụng ngày càng nhiều, đó là: .PDF.PPT. Dùng chức năng tìm hạn chế trong hai loại định dạng này có khả năng lọc thông tin rất cao, vì hai định dạng này không được dùng phổ biến trong các nguồn thông tin không có mục tiêu khoa học và giáo dục.

  • .PDF (Portable Document File): là một định dạng rất phổ biến để trao đổi thông tin qua mạng, nhờ dung lượng nhẹ, khả năng chuyển dạng từ các tập tin văn bản (.DOC, .ODT, .RTF,...) rất cao, có khả năng tích hợp vào bên trong trình duyệt mạng. 
    • Hầu hết các nhà cung cấp tài liệu, các bài báo khoa học đều sử dụng định dạng này cho các tài liệu của mình.
  • .PPT (Microsoft PowerPoint): đây là định dạng đặc trưng dùng trong các bài thuyết trình, trình chiếu. 
    • Ở các trường đại học lớn, giảng viên thường soạn bài giảng dưới hình thức này và tải lên Mạng, trong các nguồn tài nguyên của trường, để sinh viên có thể tải về tham khảo. 
    • Giới hạn tìm kiếm trong định dạng .PPT có thể giúp lọc được thông tin hiệu quả để tìm được rất nhiều bài giảng khoa học, giáo dục với hình ảnh sinh động và thông tin có giá trị.
Về đầu trang

Cũng có hai cách sử dụng:

  • Dùng hàm: "filetype:địnhdạng", không có dấu chấm trước tên định dạng.
    • Ví dụ 1: dùng hàm "geography site:edu filetype:ppt" trong Google có thể giúp tìm các tài liệu có định dạng .PPT về chủ đề "Geography" từ các trường đại học Hoa Kì (giả định là sẽ có nhiều bài giảng bằng tiếng Anh có liên quan đến "địa lí").
    • Ví dụ 2: dùng hàm "allintitle:plant biology OR physiology site:edu filetype:ppt" có thể giúp tìm các tài liệu có định dạng .PPT có nhan đề chứa các bộ từ {plant, biology} hoặc {plant, physiology} từ các trường đại học Hoa Kì (giả định là có nhiều bài giảng bằng tiếng Anh với chủ đề liên quan đến "sinh học thực vật" hoặc "sinh lí thực vật").
  • Dùng chức năng tìm kiếm nâng cao với các trường tìm kiếm đã thiết kế sẵn (giao diện đồ hoạ).

Danh sách các tính năng tìm kiếm còn dài, với những đặc thù riêng của từng công cụ. Không thể liệt kê ra hết, nhưng có vài nguyên tắc cơ bản để khai thác các tính năng này.

  • Các chức năng tìm kiếm nâng cao hầu hết được thiết kế rõ ràng, dễ hiểu qua giao diện đồ hoạ
  • Tận dụng mọi thời gian tìm kiếm thông tin để sử dụng và tích luỹ kinh nghiệm sử dụng các chức năng tìm kiếm nâng cao.
  • Sau mỗi lượt tìm kiếm với các công thức khác nhau, ghi nhận sự khác biệt trong chất lượng kết quả thu được để hiểu rõ ưu nhược điểm của từng tính năng, từng công cụ.
  • Mỗi công cụ tìm kiếm đều có phần hướng dẫn sử dụng riêng, khi cần khai thác một số tính năng nào đó, hãy tìm đọc các tài liệu hướng dẫn này.
  • Nếu có điều kiện, tìm hiểu kĩ cấu trúc Mạng và Internet, hiểu rõ cách xây dựng các website, các trang web, để nắm được bản chất hoạt động của các công cụ tìm kiếm, tức đủ khả năng diễn dịch được các kết quả mà chức năng tìm kiếm nâng cao mang lại.
Bài thực hành
Về đầu trang
Trang trước Trang chính Trang sau
Tác giả @ Meresci - 2007 Cập nhật: 11/06/2007