Số đảo ngược là gì

1

Bạn đang thắc mắc? Ghi câu hỏi của bạn và đăng ở chế độ cộng đồng [?]

10/11/2011 2:30:08 PM

Đặng Thuận Thành · Đặng Thuận Thành 14:30 11/10/2011

Trong công nghệ phần mềm, chúng tôi luôn tạo ra các chỉ mục [ví dụ: trong cơ sở dữ liệu] nhưng tôi cũng nghe rất nhiều người nói về các chỉ số đảo ngược. Có một cái gì đó khác nhau về cơ bản giữa hai? Họ nghe giống như điều tương tự.

76 hữu ích 3 bình luận 36k xem chia sẻ

answer

Trần Bảo An · Trần Bảo An 18:32 02/12/2011

Một cách sử dụng phổ biến là "... để cho phép tìm kiếm toàn văn nhanh."

Hai loại biểu thị tính định hướng . Một cái đưa bạn về phía trước thông qua chỉ mục, và cái kia đưa bạn lùi lại [nghịch đảo] thông qua chỉ mục. Đó là nó. Không có gì bí ẩn để khám phá ở đây. Mặt khác, hai loại này giống hệt nhau, đó chỉ là câu hỏi về thông tin bạn và kết quả là thông tin nào bạn đang cố gắng tìm.

Để giải quyết yêu cầu của bạn, tôi không nghĩ thực sự có một cách để biết tại sao việc sử dụng lại là ngày nay. Lý do duy nhất rất quan trọng để xác định đó là cái nào forwardvà cái nào invertedlà để tất cả chúng ta có thể có một cuộc trò chuyện về họ và mọi người đều biết chúng ta đang nói về hướng nào. Hãy nghĩ về các thuật ngữ "trái" và "phải": chúng là tương đối. Cái nào không quan trọng, ngoại trừ việc mọi người cần phải đồng ý cái nào là "bên trái" và cái nào là "bên phải" để các từ có nghĩa. Nếu, như một nền văn hóa, chúng tôi quyết định lật sang trái và phải, thì bạn sẽ có cùng một vấn đề để tìm ra "rẽ phải" so với "rẽ trái" là gì vì ý nghĩa đã được thỏa thuận đã thay đổi. Tuy nhiên, việc đặt tên là tùy ý, về ý nghĩa

Trong bình luận của bạn, nơi bạn hỏi, "làm ơn đừng chỉ xác định các thuật ngữ", bạn đang thiếu điểm và tôi nghĩ rằng bạn đang bị treo lên về từ ngữ khi hoàn toàn không có sự khác biệt giữa chúng.

Vì lợi ích của độc giả trong tương lai, bây giờ tôi sẽ cung cấp một số ví dụ về chỉ mục "chuyển tiếp" và "đảo ngược":

Ví dụ 1: Tìm kiếm trên web

Nếu bạn nghĩ rằng nghịch đảo của một chỉ mục là một thứ giống như nghịch đảo của một hàm trong toán học , trong đó nghịch đảo là một thứ đặc biệt có dạng khác, thì bạn đã nhầm: đó không phải là trường hợp ở đây.

Trong công cụ tìm kiếm, bạn có một danh sách các tài liệu [các trang trên các trang web], nơi bạn nhập một số từ khóa và nhận lại kết quả.

Một chỉ mục chuyển tiếp [hoặc chỉ mục lục] là danh sách các tài liệu và từ nào xuất hiện trong đó. Trong ví dụ tìm kiếm trên web, Google thu thập dữ liệu trên web, xây dựng danh sách các tài liệu, tìm ra từ nào xuất hiện trong mỗi trang.

Các chỉ số đảo ngược là danh sách các từ , và các văn bản, trong đó họ xuất hiện. Trong ví dụ tìm kiếm trên web, bạn cung cấp danh sách các từ [truy vấn tìm kiếm của bạn] và Google tạo ra các tài liệu [liên kết kết quả tìm kiếm].

Cả hai đều là chỉ mục - đó chỉ là một câu hỏi về hướng bạn đang đi. Chuyển tiếp là từ tài liệu-> đến-> từ, đảo ngược là từ từ-> đến-> tài liệu.

Ví dụ 2: DNS

Một ví dụ khác là tra cứu DNS [lấy tên máy chủ và trả về địa chỉ IP] và tra cứu ngược lại [lấy địa chỉ IP và cung cấp cho bạn tên máy chủ].

Ví dụ 3: Một cuốn sách

Chỉ mục ở mặt sau của một cuốn sách thực sự là một chỉ mục đảo ngược , như được xác định bởi các ví dụ ở trên - một danh sách các từ và nơi để tìm thấy chúng trong cuốn sách. Trong một cuốn sách, mục lục giống như một chỉ mục chuyển tiếp : đó là danh sách các tài liệu [chương] mà cuốn sách chứa, ngoại trừ thay vì liệt kê các từ trong các phần đó, mục lục chỉ đưa ra một tên / mô tả chung về những gì có trong các tài liệu đó [chương].

Ví dụ 4: Điện thoại di động của bạn

Các chỉ số về phía trước trong điện thoại di động của bạn là danh sách các địa chỉ liên lạc, và trong đó số điện thoại [di động, nhà, nơi làm việc] được liên kết với các địa chỉ liên lạc. Các chỉ số đảo ngược là những gì cho phép bạn tự nhập số điện thoại, và khi bạn nhấn "quay" bạn nhìn thấy tên của người đó, chứ không phải là số lượng, vì điện thoại của bạn đã đưa ra những số điện thoại và tìm thấy bạn liên lạc liên kết với nó.

190 hữu ích 5 bình luận chia sẻ

answer

Phạm Huy Tường · Phạm Huy Tường 20:05 05/12/2011

Họ gọi nó là đảo ngược chỉ vì đã có một chỉ số chuyển tiếp. Lấy ví dụ về công cụ tìm kiếm, nó bao gồm hai phần: phần đầu tiên là "trình thu thập dữ liệu và trình phân tích cú pháp web" để xây dựng một chỉ mục từ tài liệu này sang từ khác, phần thứ hai là cơ sở dữ liệu tìm kiếm xây dựng một chỉ mục từ từ này sang tài liệu khác. Do chỉ số đầu tiên tồn tại, chúng tôi tự nhiên gọi chỉ mục thứ hai là chỉ mục đảo ngược.

Nếu bạn đặt tên TOC [Mục lục] của một cuốn sách là chỉ mục, thì bạn nên gọi chỉ mục ở cuối cuốn sách là "chỉ mục đảo ngược". Hoặc, mặt khác, bạn có thể gọi TOC là chỉ mục đảo ngược.

18 hữu ích 3 bình luận chia sẻ

answer

Trần Trọng Tường · Trần Trọng Tường 16:47 05/12/2011

thông thường khi nói về chỉ mục, bạn có nghĩa là một số tính toán được thêm vào hoặc kết quả được lưu trữ của các thủ tục đã được thực hiện để tăng tốc ứng dụng [ví dụ: MySQL hoặc RDBMS khác Tham khảo MySQL các tài liệu ]. Lập chỉ mục cũng có thể liên quan đến bộ nhớ đệm, vv

Chỉ mục đảo ngược tạo ra tệp có cấu trúc chủ yếu là intender cho tìm kiếm [fulltext].

Chỉ mục đảo ngược bao gồm hai tệp chính:

Trong từ vựng là những từ phổ biến được trích từ văn bản [tất nhiên sau khi lọc các từ trong danh sách đen như đại từ]. Tệp xuất hiện giữ kết nối giữa các từ và tài liệu [word1 xuất hiện trong doc1 và doc2, không phải trong doc3]. Nó được thể hiện dưới dạng ma trận.

Trong hình trên được hiển thị quá trình tạo hai tệp được đề cập.

Nếu bạn quan tâm hơn đến vấn đề rắc rối này, tôi có thể giới thiệu cho bạn một cuốn sách tuyệt vời được viết bởi Ricardo Yated - Truy xuất thông tin hiện đại [ Xem nó trên Amazon ] - khoảng trang 200 tôi nghĩ.

Hy vọng nó giúp :-]

6 hữu ích 1 bình luận chia sẻ

answer

Hoàng Hồng Loan · Hoàng Hồng Loan 11:41 03/05/2012

bình thường đã phân biệt tuyệt vời giữa một chỉ số chuyển tiếp và một chỉ số đảo ngược nhưng đối với câu hỏi tại sao một người được gọi là một chỉ số chuyển tiếp và một chỉ số đảo ngược, có lẽ đây là lý do tại sao chúng được gọi theo cách đó ---

Lấy ví dụ về thu thập thông tin và lập chỉ mục công cụ tìm kiếm [hoặc xây dựng chỉ mục cho một cuốn sách], một chỉ mục chuyển tiếp có thể được xây dựng đồng thời trong khi bạn đang thu thập dữ liệu các trang web [hoặc đọc sách] hoặc đi tiếp . Vì vậy, nếu bạn có 10 trang web để thu thập dữ liệu [hoặc 10 chương trong một cuốn sách], bạn có thể thu thập dữ liệu trang web đầu tiên [đọc chương đầu tiên] và sau đó tạo danh sách các từ xuất hiện trong trang web [các từ xuất hiện trong chương] và tiếp tục quá trình này cho các trang web khác [các chương khác] vì vậy vào thời điểm bạn đã thu thập tất cả 10 trang web [đọc tất cả 10 chương], chỉ mục chuyển tiếp của bạn đã hoàn tất với mỗi trang web [chương] chỉ vào danh sách các từ mà nó chứa .

Nhưng để tạo một chỉ mục đảo ngược, bạn phải thu thập tất cả 10 trang web [đọc 10 chương] và sau đó lấy từng từ trong danh sách tài liệu và tìm ra tài liệu nào chứa từ đó. Vì vậy, điều này giống như đi lùi khi bạn đã thu thập dữ liệu các trang web [đọc các chương của cuốn sách] . Vì vậy, nó được gọi là một chỉ số đảo ngược.

Đây chỉ là suy đoán của tôi.

6 hữu ích 0 bình luận chia sẻ

answer

Trần Phương Trang · Trần Phương Trang 19:07 02/12/2011

Có nhiều loại chỉ số. Ví dụ: B-tree, R-tree, hash ... Đối với các mục đích khác nhau, chúng ta phải chọn chỉ mục chính xác.

Chỉ số đảo ngược là một đặc biệt. Chỉ mục đảo ngược thường được sử dụng trong công cụ tìm kiếm toàn văn. Sử dụng chỉ mục đảo ngược, chúng ta có thể tìm ra vị trí của một từ trong tài liệu [hoặc bộ tài liệu] càng nhanh càng tốt. Hãy nghĩ về giới hạn của bộ nhớ và cpu, chỉ mục khác không thể hoàn thành công việc này.

Bạn có thể đọc tài liệu lucene để biết thêm chi tiết. Đây là một công cụ tìm kiếm nguồn mở. //lucene.apache.org/java/docs/index.html

5 hữu ích 0 bình luận chia sẻ

answer

Lý Thúy Hạnh · Lý Thúy Hạnh 14:33 11/10/2011

trong các chỉ mục đảo ngược, chúng ta có dạng sau:

word1-> danh sách các tài liệu nó xuất hiện trong [thứ tự sắp xếp]

word2-> danh sách các tài liệu nó xuất hiện trong [thứ tự được sắp xếp]

Nó rất hữu ích cho việc xử lý truy vấn của công cụ tìm kiếm vì nó cho phép chúng ta tìm các tài liệu mà từ đó xuất hiện.

Bạn có thể sử dụng lear máy được giám sát để xây dựng chỉ số đảo ngược này.

2 hữu ích 4 bình luận chia sẻ

answer

Trần Trường Sơn · Trần Trường Sơn 08:43 28/04/2018

Thuật ngữ "Chỉ mục từ đảo ngược" dùng để chỉ sự thay đổi trong mối quan hệ của một tài liệu duy nhất chứa nhiều từ, với mỗi từ duy nhất chứa [hoặc xác định] một danh sách nhiều tài liệu. Điều này thực sự có một Mối quan hệ một-nhiều [Tài liệu thành từ] và đảo ngược [hoặc đảo ngược] một cách hiệu quả để tồn tại mối quan hệ Một-nhiều-nhiều "mới", đó là mỗi từ duy nhất liên quan đến Nhiều- Tài liệu [nghĩa là tất cả những gì có chứa từ đó]. Nguồn gốc của nó thực sự đơn giản và thuật ngữ "chỉ mục đảo ngược" đã được sử dụng để mô tả các chỉ mục thủ công cùng loại từ lâu trước khi máy tính và lập chỉ mục tốc độ cao điện tử thậm chí còn tồn tại [vâng, phải thừa nhận, tôi là một lập trình viên lão luyện, gần như đủ tuổi để coi Grace Hopper là "cô gái trẻ ngọt ngào" độ tuổi thích hợp để tán tỉnh trở lại khi COBOL là một ngôn ngữ mới sáng bóng]. Vui lòng không loại bỏ chúng tôi ngay bây giờ, vì đôi khi chúng tôi có thể cung cấp một hoặc hai mẩu tin lịch sử hữu ích và thậm chí có giá trị - khi RAM cá nhân của chúng tôi vẫn hoạt động, đó là. [cười]

2 hữu ích 0 bình luận chia sẻ

Xem nguồn: //stackoverflow.com//questions/7727686/whats-the-difference-between-an-inverted-index-and-a-plain-old-index

Video liên quan

Chủ Đề