corpus
corpus的意思是“文集;集子;軀干;肉體”。它主要在計算機科學領域用于NLP(自然語言處理)中,表示語料庫,即大型的、在某一領域內(如小說、新聞、科技等)的連續文本數據。
【記】corp軀體,us我們-我們的身體就是各個器官的全集corp=copy,us我們:把我們copy一萬份裝訂起來-《G友大全》
用作名詞(n.)
- The bilingual corpus in this paper is LDC parallel texts in Hong Kong newspaper.
本文中所用的雙語語料是LDC的關于香港的雙語新聞報道。 - So the veracity of chunking descends on real different field corpus.
因而,在跨領域的真實語料情況下,語塊識別的精確率有很大的下降。 - I've got the corpus of Shakespeare's works.
我有莎士比亞全集。 - This corpus has altogether 15 volumes.
這部文集共有十五卷。 - This works becomes the uncommon literature in linguistics region because of the learning spirit and learning creativity exhibiting in this corpus.
這部文集表現出的學術精神和學術創獲,使其成為語言學界不可多得的學術精品。
2. corpus analysis:語料庫分析,一種基于大規模文本數據的研究方法,用于分析語言的使用和變化。
3. corpus-based approach:基于語料庫的方法,一種語言教學方法,通過分析大規模文本數據來教授語言結構和用法。
4. text corpus:文本語料庫,一種包含大量文本數據的集合,可用于各種研究目的,如自然語言處理、文本挖掘等。
5. corpus-driven development:語料庫驅動的開發,一種軟件開發方法,通過分析大規模文本數據來設計和測試軟件系統。
6. corpus-based translation:基于語料庫的翻譯,一種翻譯方法,通過分析大規模文本數據來比較源語言和目標語言的結構和用法。
以上是留學之路(www.freshsetoftracks.com)小編為您整理的corpus單詞相關內容。