Kỹ thuật tìm kiếm thông tin với Google
Ngày nay, với sựphát triển vượt bậc của công nghệthông tin, nhu cầu tìm hiểu học hỏi
khám phá tri thức rất là lớn, trong đó việc sửdụng Internet một cách hiệu quảrất là quan
trọng. Internet được coi nhưlà một kho rác của nhân loại, người ta có thểquăng lên nó
bất cứthứgì người ta thích, tuy nhiên nếu biết cách, ta vẫn có thểtìm từnó những kiến
thức bổích thông qua những nguồn cung cấp tin cậy. Thông qua đềtài này, chúng tôi
muốn cung cấp cho những bạn vừa bước chân vào ngưỡng cửa tin học, những kiến thức
và kỹnăng cần thiết đểcó thểtìm kiếm thông tin trên Internet một cách hiệu quảphục vụ
cho việc học tập và nghiên cứu của mình.
Vào cuối bài, chúng tôi sẽtrình lại tất cảcác tài liệu tham khảo mà chúng tôi dùng đểviết
lên bài báo cáo này. Các tài liệu này rất hữu ích nếu các bạn có thì giờvà trình độAnh ngữ
đềnghịhãy đọc thêm chúng đểhiểu thêm những khía cạnh, những nội dung mà chúng tôi
không có dịp đềcập đến.
htm và một cho html. III.4 Cache Xem thông tin của trang web chứa trong cache của Google. Đây là một tính năng rất hay của Google, mặc dù trang web bạn muốn xem đã xoá sổ không còn hiện hữu trên Internet nữa nhưng Google vẫn lưu lại rất nhiều thông tin của nó trong cơ sở dữ liệu, và trong thời gian các thông tin này còn chưa bị xoá khỏi Google thì ta vẫn có thể đọc được nó. Vd: cache:www.tuoitre.com.vn Để giảm dung lượng của nội dung các trang web trong cache, Google chỉ chứa thông tin văn bản mà không chứa hình ảnh, và khi chúng ta xem, Google sẽ tải các hình ảnh trên các trang web đó từ nơi sinh ra chúng vì vậy nếu các trang web này bị xoá, các bạn chỉ còn thấy chữ mà không thấy hình ảnh. III.5 Define Nhiều khi chúng ta cần biết ý nghĩa, khái niệm của một từ chuyên môn nào đó, ta có thể dùng từ khoá đặc biệt của Google là define. Đơn giản bạn chỉ việc nhập “define” sau đó cách ra một khoảng trắng và nhập một từ hay một cụm từ mà bạn muốn xem định nghĩa nó. Vd: define HTTP Bạn có thể tìm thấy danh sách các định nghĩa (a list of definitions) bằng cách ngăn cách giữa từ khoá đặc biệt define và cụm từ cần định nghĩa bằng một dấu hai chấm (colon). Vd define:HTTP III.6 Site Khi bạn nhập từ khoá site theo sau là dấu hai chấm và tên site, Google sẽ tìm thông tin bạn muốn hạn chế chỉ trong phạm vi site đó mà thôi. Ví dụ, để tìm thông tin liên quan đến Windows Vista trên website của báo Tuổi trẻ ta nhập bộ từ khoá “Windows Vista” site:www.tuoitre.com.vn IV. Một vài đặc thù của Google Google cung cấp cho ta thêm một số phương tiện để giảm thiểu khó khăn của việc truy tìm nếu như bạn gõ vào từ khoá và kết quả trả về với số trang quá nhiều, do từ khoá bạn gõ quá chung chung, phổ biến. IV.1 Tìm thêm dữ liệu theo liên hệ (related search) Sau khi tìm kiếm, Google có thể giúp bạn đào sâu sự truy tìm bằng cách cung cấp các bộ từ khoá dưới dạng các dòng link, giúp thu nhỏ thị trường tìm kiếm (thường gặp khi số trang trả về theo từ khóa của bạn là quá lớn). Thực ra, nếu chúng ta biết cách chọn từ khoá để gõ thì sẽ không cần đến chức năng này. Ví dụ nếu chúng ta tìm kiếm thông tin về sao hoả mà dùng từ khoá mars thì số lượng trang tìm được sẽ rất lớn. Vì vậy, để tránh trường hợp như vậy, chúng ta có thể gõ thêm một vài từ khoá liên quan để Google thu nhỏ phạm vi tìm kiếm. IV.2 Trang tương tự và trang có chính tả gần giống Trong một số trường hợp thì Google sẽ đưa thêm chức năng tìm các trang tương tự như các trang mà Google nghĩ là hữu dụng cho chúng ta. Để sử dụng chức năng này bạn chỉ việc bấm vào liên kết tương ứng nếu có như “Did you mean ”, “Similar pages”. Các chức năng này làm việc tự động ngay khi bạn nhập bộ từ khoá. IV.3 Dịch nội dung trang web sang tiếng Anh Google có khả năng dịch lại trang tìm thấy sang thứ tiếng của người dùng nếu như trang tìm thấy được viết bằng ngôn ngữ mà người dùng nhìn thì nhìn nhưng chẳng biết nó viết cái gì cả. Khi kết quả trang trả về không là tiếng Anh (non_English), sẽ có một liên kết “Translate this page” nằm ở cuối tên tiêu đề của trang web đó, bạn chỉ việc nhấp vào liên kết đó sẽ hiện ra trang kết quả bằng tiếng Anh. Hiện tại Google có khả năng dịch các trang tìm thấy không có nội dung bằng tiếng Anh (như là tiếng Ý, Pháp, Tây Ban Nha, Đức) sang tiếng Anh. IV.4 Trang có từ nối dài (stemming) Google cho phép tìm thêm những từ có chứa từ khoá mà chúng ta nhập vào. Ví dụ khi bạn gõ từ khoá tutor, Google sẽ tìm luôn các từ như tutors, tutorial IV.5 Chống hội tụ (cluster) Trong quá trình tìm kiếm nếu Google thấy rằng các trang tìm ra có thể ở chung một trang chỉ chọn ra một trang đại diện còn các trang khác sẽ được xếp gọn vào và bạn có thể khai triển thành nhiều trang nếu bạn muốn Điều này làm cho sự tìm kiếm sẽ dễ hơn và ít bị nhiễu dẫn đến loạn thông tin của cùng một trang. VI. Những kỹ năng cần thiết trong việc tìm kiếm thông tin VI.1 Sử dụng đúng chỗ các máy truy tìm Tuy Google là một cỗ máy truy tìm nổi tiếng, nhưng nó cũng có điểm yếu, điểm mạnh của nó. Tuỳ theo mục đích, nội dung của thông tin tìm kiếm mà bạn nên lựa chọn trang truy tìm cho thích hợp như Yahoo chẳng hạn chứ không nhất thiết cứ là anh Google. VI.2 Lựa chọn từ khoá Thông thường chúng ta cứ nghĩ nếu muốn tìm thông tin gì thì cứ việc kết nối Internet, mở trình duyệt (browser) vào trang tìm kiếm và gõ vào từ khoá liên quan đến thông tin mình tìm và cứ việc ngồi rung đùi chờ kết quả trả về. Thực tế không đơn giản như vậy, như đã nói ở trên với việc thông tin bùng nổ hiện nay, kết quả cho từ khoá mà bạn gõ vào là số lượng trang thường rất nhiều thậm chí đến mấy ngàn trang, thì làm sao biết trang nào cần mà mở ra (mở hết chắc chết mà mở đại ngẫu nhiên thì chưa chắc có được thông tin mình cần). Và có lúc ta gõ vào lại nhận kết quả quá ít thậm chí không có kết quả nào. Do đó cần xem xét và lựa chọn từ khoá cho kết quả trả về tương đối chính xác và hạn chế phạm vi tìm kiếm. Để làm được điều này bạn cần đáp ứng một số yêu cầu sau • Vốn sinh ngữ: nếu bạn chỉ mỗi ngôn ngữ mẹ đẻ thì bạn sẽ gặp trở ngại lớn. Đa số các trang web sẽ thông tin bằng ngôn ngữ riêng và có thể trình bày thêm một ngôn ngữ tiếng Anh, như vậy việc có thêm một ngôn ngữ khác là điều khó tránh khỏi nhất là tiếng Anh, vì khi bạn gõ từ khoá bằng tiếng Anh xác xuất tìm ra sẽ lớn nhất. • Kiến thức tối thiểu về thông tin mà mình đang tìm • Sự kiên trì: nếu bạn gõ vào từ khoá và kết quả trả về quá nhiều hay không như ý thì bạn nên xem lại từ khóa đó có chính xác không (có cần thêm hay bớt chữ nào, đúng chính tả không) • Từ điển: nhiều khi chúng ta tìm không thấy, hay không chính xác do từ ta gõ quá chung chung hay quá ư nhiều nghĩa (ambiguous). Dùng từ điển hay sách tra cứu để kiếm ra chữ khác đặc biệt, sát với thông tin mình tìm và không chứa nhiều ý nghĩa khác, hay là tìm kiếm từ khoá theo chuyên môn của ngành đó như Tin học, điện tử... nếu có. Lưu ý: Khi bạn gõ từ khoá tiếng Anh, trạng từ hay liên từ mà không đứng trong dấu ngoặc kép “ ” thường bị Google và các cỗ máy tìm kiếm khác bỏ qua không xét, chúng ta muốn Google kiếm thì cần để chúng trong dấu ngoặc kép “ ”. Tài liệu tham khảo 1) irc.dev-zone.com: “Google hacks and some tricks on the internet” bài viết của SawyeR 2) Vietssciences.free.fr: “Khai Thác Search Engine Cho Nhu Cầu Học Tập và Nghiên Cứu” 3) www.smallbusinessbrief.com: “Makes you think about how people will begin to search” Mục lục Mở đầu........................................................................................................................ 3 I. Khái niệm về Search Engine-Cỗ máy tìm kiếm............................................................. 4 I.1 Spider................................................................................................................. 4 I.2 Meta-search engine ............................................................................................. 4 I.3 Hierarchical search engine.................................................................................... 5 I.4 Các loại search engine phổ biến............................................................................ 5 II. Google.................................................................................................................... 7 II.1 Giới thiệu về Google ........................................................................................... 7 II.2 Cách sử dụng Google.......................................................................................... 8 II.3 Các phép toán đơn giản thông dụng trong Google ................................................ 8 II.4 Sử dụng các phép toán Boolean .........................................................................11 III. Tìm kiếm nâng cao................................................................................................15 III.1 Intitle: .............................................................................................................15 III.2 Inurl................................................................................................................17 III.3 Inanchor..........................................................................................................17 III.3 Filetype ...........................................................................................................18 III.4 Cache..............................................................................................................19 III.5 Define .............................................................................................................20 III.6 Site .................................................................................................................21 IV. Một vài đặc thù của Google ....................................................................................22 IV.1 Tìm thêm dữ liệu theo liên hệ (related search)....................................................22 IV.2 Trang tương tự và trang có chính tả gần giống ...................................................22 IV.3 Dịch nội dung trang web sang tiếng Anh ............................................................23 IV.4 Trang có từ nối dài (stemming) .........................................................................23 IV.5 Chống hội tụ (cluster) .......................................................................................23 VI. Những kỹ năng cần thiết trong việc tìm kiếm thông tin .............................................23 VI.1 Sử dụng đúng chỗ các máy truy tìm...................................................................23 VI.2 Lựa chọn từ khoá .............................................................................................23 Tài liệu tham khảo ......................................................................................................25
File đính kèm: