Kỹ thuật tìm kiếm thông tin với Google

Ngày nay, với sựphát triển vượt bậc của công nghệthông tin, nhu cầu tìm hiểu học hỏi

khám phá tri thức rất là lớn, trong đó việc sửdụng Internet một cách hiệu quảrất là quan

trọng. Internet được coi nhưlà một kho rác của nhân loại, người ta có thểquăng lên nó

bất cứthứgì người ta thích, tuy nhiên nếu biết cách, ta vẫn có thểtìm từnó những kiến

thức bổích thông qua những nguồn cung cấp tin cậy. Thông qua đềtài này, chúng tôi

muốn cung cấp cho những bạn vừa bước chân vào ngưỡng cửa tin học, những kiến thức

và kỹnăng cần thiết đểcó thểtìm kiếm thông tin trên Internet một cách hiệu quảphục vụ

cho việc học tập và nghiên cứu của mình.

Vào cuối bài, chúng tôi sẽtrình lại tất cảcác tài liệu tham khảo mà chúng tôi dùng đểviết

lên bài báo cáo này. Các tài liệu này rất hữu ích nếu các bạn có thì giờvà trình độAnh ngữ

đềnghịhãy đọc thêm chúng đểhiểu thêm những khía cạnh, những nội dung mà chúng tôi

không có dịp đềcập đến.

pdf26 trang | Chia sẻ: hongmo88 | Lượt xem: 1332 | Lượt tải: 0download
Bạn đang xem trước 20 trang tài liệu Kỹ thuật tìm kiếm thông tin với Google, để xem tài liệu hoàn chỉnh bạn click vào nút TẢI VỀ ở trên
 htm và một cho html. 
III.4 Cache 
Xem thông tin của trang web chứa trong cache của Google. 
Đây là một tính năng rất hay của Google, mặc dù trang web bạn muốn xem đã xoá sổ 
không còn hiện hữu trên Internet nữa nhưng Google vẫn lưu lại rất nhiều thông tin của 
nó trong cơ sở dữ liệu, và trong thời gian các thông tin này còn chưa bị xoá khỏi 
Google thì ta vẫn có thể đọc được nó. 
Vd: cache:www.tuoitre.com.vn 
 Để giảm dung lượng của nội dung các trang web trong cache, Google chỉ 
chứa thông tin văn bản mà không chứa hình ảnh, và khi chúng ta xem, Google 
sẽ tải các hình ảnh trên các trang web đó từ nơi sinh ra chúng vì vậy nếu các 
trang web này bị xoá, các bạn chỉ còn thấy chữ mà không thấy hình ảnh. 
III.5 Define 
Nhiều khi chúng ta cần biết ý nghĩa, khái niệm của một từ chuyên môn nào đó, ta có 
thể dùng từ khoá đặc biệt của Google là define. Đơn giản bạn chỉ việc nhập “define” 
sau đó cách ra một khoảng trắng và nhập một từ hay một cụm từ mà bạn muốn xem 
định nghĩa nó. 
Vd: define HTTP 
 Bạn có thể tìm thấy danh sách các định nghĩa (a list of definitions) bằng 
cách ngăn cách giữa từ khoá đặc biệt define và cụm từ cần định nghĩa bằng một 
dấu hai chấm (colon). 
Vd define:HTTP 
 III.6 Site 
Khi bạn nhập từ khoá site theo sau là dấu hai chấm và tên site, Google sẽ tìm thông 
tin bạn muốn hạn chế chỉ trong phạm vi site đó mà thôi. 
Ví dụ, để tìm thông tin liên quan đến Windows Vista trên website của báo Tuổi trẻ ta 
nhập bộ từ khoá “Windows Vista” site:www.tuoitre.com.vn 
 IV. Một vài đặc thù của Google 
Google cung cấp cho ta thêm một số phương tiện để giảm thiểu khó khăn của việc truy 
tìm nếu như bạn gõ vào từ khoá và kết quả trả về với số trang quá nhiều, do từ khoá 
bạn gõ quá chung chung, phổ biến. 
IV.1 Tìm thêm dữ liệu theo liên hệ (related search) 
Sau khi tìm kiếm, Google có thể giúp bạn đào sâu sự truy tìm bằng cách cung cấp các 
bộ từ khoá dưới dạng các dòng link, giúp thu nhỏ thị trường tìm kiếm (thường gặp khi 
số trang trả về theo từ khóa của bạn là quá lớn). Thực ra, nếu chúng ta biết cách chọn 
từ khoá để gõ thì sẽ không cần đến chức năng này. 
Ví dụ nếu chúng ta tìm kiếm thông tin về sao hoả mà dùng từ khoá mars thì số lượng 
trang tìm được sẽ rất lớn. Vì vậy, để tránh trường hợp như vậy, chúng ta có thể gõ 
thêm một vài từ khoá liên quan để Google thu nhỏ phạm vi tìm kiếm. 
IV.2 Trang tương tự và trang có chính tả gần giống 
Trong một số trường hợp thì Google sẽ đưa thêm chức năng tìm các trang tương tự 
như các trang mà Google nghĩ là hữu dụng cho chúng ta. 
Để sử dụng chức năng này bạn chỉ việc bấm vào liên kết tương ứng nếu có như “Did 
you mean ”, “Similar pages”. 
Các chức năng này làm việc tự động ngay khi bạn nhập bộ từ khoá. 
IV.3 Dịch nội dung trang web sang tiếng Anh 
Google có khả năng dịch lại trang tìm thấy sang thứ tiếng của người dùng nếu như 
trang tìm thấy được viết bằng ngôn ngữ mà người dùng nhìn thì nhìn nhưng chẳng 
biết nó viết cái gì cả. 
Khi kết quả trang trả về không là tiếng Anh (non_English), sẽ có một liên kết 
“Translate this page” nằm ở cuối tên tiêu đề của trang web đó, bạn chỉ việc nhấp vào 
liên kết đó sẽ hiện ra trang kết quả bằng tiếng Anh. Hiện tại Google có khả năng dịch 
các trang tìm thấy không có nội dung bằng tiếng Anh (như là tiếng Ý, Pháp, Tây Ban 
Nha, Đức) sang tiếng Anh. 
IV.4 Trang có từ nối dài (stemming) 
Google cho phép tìm thêm những từ có chứa từ khoá mà chúng ta nhập vào. Ví dụ khi 
bạn gõ từ khoá tutor, Google sẽ tìm luôn các từ như tutors, tutorial 
IV.5 Chống hội tụ (cluster) 
Trong quá trình tìm kiếm nếu Google thấy rằng các trang tìm ra có thể ở chung một 
trang chỉ chọn ra một trang đại diện còn các trang khác sẽ được xếp gọn vào và bạn 
có thể khai triển thành nhiều trang nếu bạn muốn Điều này làm cho sự tìm kiếm sẽ 
dễ hơn và ít bị nhiễu dẫn đến loạn thông tin của cùng một trang. 
VI. Những kỹ năng cần thiết trong việc tìm kiếm thông tin 
VI.1 Sử dụng đúng chỗ các máy truy tìm 
Tuy Google là một cỗ máy truy tìm nổi tiếng, nhưng nó cũng có điểm yếu, điểm mạnh 
của nó. Tuỳ theo mục đích, nội dung của thông tin tìm kiếm mà bạn nên lựa chọn 
trang truy tìm cho thích hợp như Yahoo chẳng hạn chứ không nhất thiết cứ là anh 
Google. 
VI.2 Lựa chọn từ khoá 
Thông thường chúng ta cứ nghĩ nếu muốn tìm thông tin gì thì cứ việc kết nối Internet, 
mở trình duyệt (browser) vào trang tìm kiếm và gõ vào từ khoá liên quan đến thông 
tin mình tìm và cứ việc ngồi rung đùi chờ kết quả trả về. Thực tế không đơn giản như 
vậy, như đã nói ở trên với việc thông tin bùng nổ hiện nay, kết quả cho từ khoá mà 
bạn gõ vào là số lượng trang thường rất nhiều thậm chí đến mấy ngàn trang, thì làm 
sao biết trang nào cần mà mở ra (mở hết chắc chết  mà mở đại ngẫu nhiên thì chưa 
chắc có được thông tin mình cần). Và có lúc ta gõ vào lại nhận kết quả quá ít thậm chí 
không có kết quả nào. Do đó cần xem xét và lựa chọn từ khoá cho kết quả trả về 
tương đối chính xác và hạn chế phạm vi tìm kiếm. 
Để làm được điều này bạn cần đáp ứng một số yêu cầu sau 
• Vốn sinh ngữ: nếu bạn chỉ mỗi ngôn ngữ mẹ đẻ thì bạn sẽ gặp trở ngại lớn. Đa 
số các trang web sẽ thông tin bằng ngôn ngữ riêng và có thể trình bày thêm 
một ngôn ngữ tiếng Anh, như vậy việc có thêm một ngôn ngữ khác là điều khó 
tránh khỏi nhất là tiếng Anh, vì khi bạn gõ từ khoá bằng tiếng Anh xác xuất tìm 
ra sẽ lớn nhất. 
• Kiến thức tối thiểu về thông tin mà mình đang tìm 
• Sự kiên trì: nếu bạn gõ vào từ khoá và kết quả trả về quá nhiều hay không như 
ý thì bạn nên xem lại từ khóa đó có chính xác không (có cần thêm hay bớt chữ 
nào, đúng chính tả không) 
• Từ điển: nhiều khi chúng ta tìm không thấy, hay không chính xác do từ ta gõ 
quá chung chung hay quá ư nhiều nghĩa (ambiguous). Dùng từ điển hay sách 
tra cứu để kiếm ra chữ khác đặc biệt, sát với thông tin mình tìm và không chứa 
nhiều ý nghĩa khác, hay là tìm kiếm từ khoá theo chuyên môn của ngành đó 
như Tin học, điện tử... nếu có. 
Lưu ý: Khi bạn gõ từ khoá tiếng Anh, trạng từ hay liên từ mà không đứng 
trong dấu ngoặc kép “ ” thường bị Google và các cỗ máy tìm kiếm khác bỏ qua 
không xét, chúng ta muốn Google kiếm thì cần để chúng trong dấu ngoặc kép “ ”. 
Tài liệu tham khảo 
1) irc.dev-zone.com: “Google hacks and some tricks on the internet” bài viết của 
SawyeR 
2) Vietssciences.free.fr: “Khai Thác Search Engine Cho Nhu Cầu Học Tập và Nghiên 
Cứu” 
3) www.smallbusinessbrief.com: “Makes you think about how people will begin to 
search”
Mục lục 
Mở đầu........................................................................................................................ 3 
I. Khái niệm về Search Engine-Cỗ máy tìm kiếm............................................................. 4 
I.1 Spider................................................................................................................. 4 
I.2 Meta-search engine ............................................................................................. 4 
I.3 Hierarchical search engine.................................................................................... 5 
I.4 Các loại search engine phổ biến............................................................................ 5 
II. Google.................................................................................................................... 7 
II.1 Giới thiệu về Google ........................................................................................... 7 
II.2 Cách sử dụng Google.......................................................................................... 8 
II.3 Các phép toán đơn giản thông dụng trong Google ................................................ 8 
II.4 Sử dụng các phép toán Boolean .........................................................................11 
III. Tìm kiếm nâng cao................................................................................................15 
III.1 Intitle: .............................................................................................................15 
III.2 Inurl................................................................................................................17 
III.3 Inanchor..........................................................................................................17 
III.3 Filetype ...........................................................................................................18 
III.4 Cache..............................................................................................................19 
III.5 Define .............................................................................................................20 
III.6 Site .................................................................................................................21 
IV. Một vài đặc thù của Google ....................................................................................22 
IV.1 Tìm thêm dữ liệu theo liên hệ (related search)....................................................22 
IV.2 Trang tương tự và trang có chính tả gần giống ...................................................22 
IV.3 Dịch nội dung trang web sang tiếng Anh ............................................................23 
IV.4 Trang có từ nối dài (stemming) .........................................................................23 
IV.5 Chống hội tụ (cluster) .......................................................................................23 
VI. Những kỹ năng cần thiết trong việc tìm kiếm thông tin .............................................23 
VI.1 Sử dụng đúng chỗ các máy truy tìm...................................................................23 
VI.2 Lựa chọn từ khoá .............................................................................................23 
Tài liệu tham khảo ......................................................................................................25 

File đính kèm: