• slider
  • slider

Bạn cần biết bao nhiêu từ trong tiếng Tây Ban Nha? Phần 1

Bạn cần phải biết bao nhiêu từ tiếng Tây Ban Nha? Điều này sẽ bắt đầu với một chút kỹ thuật và học thuật...
...nhưng tôi hứa rằng nếu bạn lướt qua nó, bạn sẽ nhận được một số thông tin thực tế rất hữu ích mà bạn có thể sử dụng tăng cường khả năng học tập của bạn về ngôn ngữ Tây Ban Nha hoặc bất kỳ ngôn ngữ thứ hai nào, bằng cách không chỉ làm tốt hơn mà còn làm việc hiệu quả hơn và do đó cần thời gian để trở nên thông thạo.

Thêm vào đó, nó sẽ giúp bạn thiết kế một hệ thống nghiên cứu dựa trên chính xác những gì bạn muốn làm với tiếng Tây Ban Nha: nói chuyện với người bản xứ, đọc tiểu thuyết, đọc và /hoặc viết trong lĩnh vực kỹ thuật hoặc học thuật, ... hoặc kết hợp một số việc trên. Trước tiên, chúng ta hãy bắt đầu với một số định nghĩa để chúng ta có thể hiểu những gì đang xảy ra ở đây:

Lexeme: Một lexeme là sự giảm một từ với ý nghĩa cơ bản nhất. Ví dụ: từ " water " có thể là một danh từ đề cập đến H2O, hoặc nó có thể là một động từ đề cập đến hành động tưới nước cho cây trồng, do đó trong trường hợp này được tính là hai lexemes riêng biệt và khác biệt, mặc dù nó là cùng một từ, " water ".
Lý do thực hiện theo cách này là nếu bạn phải học cả hai định nghĩa thì theo mục đích của chúng ta, giống như học hai từ khác nhau mà mỗi từ chỉ có một định nghĩa - nó đòi hỏi cùng một khoảng thời gian và công sức và không gian bộ nhớ trong đầu của bạn, vì vậy khi chúng ta nói "Bạn cần biết bao nhiêu từ?" Chúng tôi đang tính lexemes, hoặc trong thuật ngữ là " definitions".

>>Xem thêm: Mục tiêu thông thạo tiếng Tây Ban Nha trong 90 ngày

Nói cách khác, chúng ta nói rằng mỗi định nghĩa được tính là một "word" riêng biệt (khi nó được thực hiện theo cách này, nó được gọi là a lexeme), bất kể các định nghĩa này có liên quan đến sự kết hợp chính xác của các chữ cái (những thứ thường được gọi là a word) hay không: danh từ " water " và động từ " water " là hai từ riêng biệt (hay lexemes, chính xác hơn), phải không? Đúng. Tôi cũng nên lưu ý rằng các hình thức khác nhau (như với động từ) của cùng một từ, miễn là cùng một định nghĩa cơ bản được duy trì, được tính là một lexeme, do đó "is" và "are" không phải là hai lexemes riêng biệt, nhưng là một.

Ngoại ngữ: cánh cửa đi ra thế giới bên ngoài!
Ngoại ngữ: cánh cửa đi ra thế giới bên ngoài!

Corpus: Tiếng Latin cho " body ". Kiến thức về cơ thể mà bạn dựa vào thông tin của bạn về nó, trong trường hợp này là sách, báo, bảng điểm của ngôn ngữ nói, vv… Về cơ bản nó có nghĩa là tập dữ liệu của bạn. Về việc xác định tần suất từ, corpus là cái mà bạn đã xem xét để xác định những từ nào xảy ra và với tần số nào. Nếu corpus của bạn để làm danh sách tần số cho tiếng Anh là những bản kinh thánh thế kỷ 13, thì dữ liệu của bạn sẽ không liên quan đến ngôn ngữ hiện đại.

>> Xem thêm: Cách học tiếng Tây Ban Nha hiệu quả hiện nay

Register: Những thiết lập ngôn ngữ được sử dụng Chúng tôi sẽ có ba đăng ký riêng biệt mà chúng tôi sẽ sử dụng: ngôn ngữ nói miệng, viết tiểu thuyết và viết tiểu thuyết không hư cấu.

Range: Từ này được sử dụng rộng rãi như thế nào. Nói cách khác, nếu tài liệu của bạn bao gồm bốn cuốn sách và một từ cụ thể hiển thị như 5% của tất cả các từ trong một cuốn sách và không bao giờ xuất hiện ở bất kỳ sách nào khác, đó là một cuốn sách có lượng từ không chính xác vì nó thực sự quan trọng hơn nhiều-bạn sẽ nói rằng từ cụ thể " has a very narrow range ".
Một ví dụ có thể là nếu bạn có một cuốn sách chế độ ăn kiêng như là một phần của bộ sưu tập của bạn, chúng tôi sẽ giả sử nó nhỏ, bạn có thể thấy rằng từ "protein", " cardiovascular " và "glycemic" kết thúc trong danh sách tần số của bạn. Có thể chúng không nên là vì những từ này thường không được sử dụng trong cuộc trò chuyện hàng ngày hoặc giao tiếp bằng phần lớn văn bản.
Điều này là do bạn đã có một vài tywf là một phần của tập tài liệu có một chủ đề rất hẹp và cụ thể mà thông thường không phải là thảo luận rất thường xuyên. Và do đó một số từ được sử dụng trong đó có một phạm vi rất hẹp. Thông thường nó sẽ không là điều gì đó cực đoan, bởi vì những ngoại lệ rõ ràng như vậy sẽ bị gỡ bỏ khỏi tập văn bởi những nhà nghiên cứu có thẩm quyền, nhưng những gì bạn sẽ thấy là những từ được sử dụng rất thường xuyên trong giao tiếp bằng văn bản nhưng hầu như không có trong giao tiếp nói và ngược lại, đó là điều quan trọng và cần lưu ý.
 
Thứ nhất, một số dữ liệu

Nghiên cứu cơ bản mà tôi đang thực hiện ở đây là do Mark Davies của Đại học Brigham Young thực hiện, tôi sẽ nhúng vào bên dưới để bạn có thể đọc, tải xuống, bất cứ điều gì bạn muốn làm (tôi biết nó hơi nhỏ, Chỉ cần nhấp vào "Toàn màn hình"):
https://www.scribd.com/doc/35527699/Spanish-Word-Frequency-Study#download&from_embed - Nghiên cứu về Tần suất tiếng Tây Ban Nha của Andrew Tracey trên Scribd
 
>>Tham khảo: ​Tổng hợp phương pháp học tiếng Tây Ban Nha hiệu quả p2

Đây là một nghiên cứu thực sự độc đáo và có giá trị: bạn sẽ nghĩ rằng sẽ có dữ liệu beaucoup ở đó liên quan đến danh sách tần suất từ ​​/ từ điển bằng tiếng Tây Ban Nha, nhưng không có. Lý do chính là nó rất damned khó khăn, tốn thời gian, và đắt tiền để làm một nghiên cứu như thế này đúng. Nghiên cứu so sánh gần nhất gần đây nhất là một nghiên cứu được thực hiện vào năm 1964 (ông đề cập đến nó ngay từ đầu).
Họ đã trích xuất 6.000 lexemes thường xuyên nhất và phá vỡ nó bằng văn học hư cấu, viết tiểu thuyết, và truyền miện (nói); họ tiếp tục tổ chức dữ liệu theo kiểu lexeme (danh từ, tính từ, trạng từ, v.v.) để bạn sẽ thấy loại từ cụ thể nào được sử dụng nhiều nhất, do đó cho phép bạn tập trung nghiên cứu một cách hợp lý.

Bạn có thường dùng từ điển để tra cứu ngoại ngữ?
Bạn có thường dùng từ điển để tra cứu ngoại ngữ?

Nhân tiện, từ điển tần số mà họ đề cập, nghiên cứu này được viết về, có chứa toàn bộ danh sách 6000 lexemes tần số cao nhất, có sẵn trên Amazon nếu bạn quan tâm. Vì một lý do nào đó, bìa cứng đắt tiền một cách đáng kinh ngạc với giá 135 đô la, nhưng họ đã có phiên bản bìa mềm ở đây và một phiên bản nhẹ nhàng ở đây với mức giá hợp lý hơn nhiều (tương ứng là 34,15 $ và 28,76 $)
Theo nghiên cứu trên, đối với người Tây Ban Nha:

- Học 1000 từ đầu tiên được sử dụng nhiều nhất trong toàn bộ ngôn ngữ sẽ cho phép bạn hiểu 76.0% tất cả các văn bản phi tiểu thuyết, 79.6% trong tất cả các văn bản tiểu thuyết, và 87.8% đáng kinh ngạc của tất cả các lời nói miệng.

- Học 2000 từ thường được sử dụng nhiều nhất sẽ giúp bạn đạt được 84% về các văn bản phi tiểu thuyết, 86,1% cho văn bản tiểu thuyết và 92,7% đối với bài phát biểu miệng. Và học 3000 từ hàng đầu được sử dụng phổ biến nhất sẽ giúp bạn đạt được 88,2% về các văn bản phi tiểu thuyết, 89,6% cho văn bản tiểu thuyết và 94,0% đối với bài phát biểu nói.

- Về cơ bản, chỉ cần học 1000 từ hàng đầu, nếu bạn chủ yếu quan tâm đến việc nói chuyện với người như hầu hết người học ngôn ngữ thì hãy giúp bạn hiểu được khoảng 90% ngôn ngữ nói - điều này là quá đủ để có thể lộn xộn qua cuộc hội thoại gần như bất kỳ. Chắc chắn, bạn sẽ phải dừng loa thường xuyên để xác định từ cho bạn và / hoặc bạn có thể phải kéo ra khỏi từ điển của bạn khá thường xuyên, nhưng quan điểm của tôi là nó là đủ của một cơ sở để bạn thực sự bắt đầu nói chuyện với mọi người (là phần quan trọng nhất của việc học bất kỳ ngôn ngữ nào: nói chuyện với người bản địa) -bạn sẽ có thể nói gần như bất cứ điều gì bạn cần bằng cách này hay cách khác, và bạn sẽ có thể hiểu được ý nghĩa chung của những gì người khác đang nói với bạn, ngay cả khi bạn phải dừng lại và yêu cầu họ giúp đỡ một vài lần.

Giáo sư Arguelles, được cho là một trong những chuyên gia hàng đầu trên thế giới về học ngôn ngữ và bản thân ông, thông thạo 11 ngôn ngữ và đã nghiên cứu 58 ở một khía cạnh nào đó, đã đề cập đến vấn đề này trong một chủ đề hấp dẫn trên diễn đàn học ngôn ngữ ưa thích của tôi, HTLAL, liên quan đến bao nhiêu từ bạn cần phải học (anh ấy trực tiếp nghiên cứu ở đây) và thực hiện một công việc tuyệt vời để nấu những thứ này cho người học ngôn ngữ theo những điều thực tế hữu ích cho chúng ta:

>>Có thể bạn quan tâm: Cách trang web học tiếng Tây Ban Nha

"Điều đáng thất vọng về những con số và số liệu  thống kê này là chúng không thể được ghim chính xác và do đó chúng khác nhau giữa nguồn này với nguồn khác. Những con số tròn mà tôi sử dụng để giải thích cho học sinh của mình, tôi thường viết mục tiêu lên bảng, nhưng tôi không có kỹ năng máy tính để vẽ vòng tròn trong bài đăng này, vì vậy tôi sẽ phải đưa ra một danh sách:

- 250 từ tạo thành cốt lõi thiết yếu của một ngôn ngữ, những người mà không có bạn không thể xây dựng bất kỳ câu.

- 750 từ là những từ ngữ được sử dụng mỗi ngày bởi mỗi người nói ngôn ngữ.

- 2500 từ cấu thành nên những từ ngữ cho phép bạn thể hiện tất cả những gì bạn có thể muốn nói, mặc dù thường xuyên là những lời nói xáo trộn kỳ cục.

- 5000 từ tạo thành từ vựng hoạt động của người bản ngữ mà không có giáo dục đại học.

- 10.000 từ tạo thành từ vựng hoạt động của người bản xứ với trình độ học vấn cao hơn.

- 20.000 từ tạo thành những gì bạn cần phải nhận thức một cách thụ động để đọc, hiểu và thưởng thức một tác phẩm văn học như một cuốn tiểu thuyết của một tác giả đáng chú ý.

Học phần trọng tâm của ngoại ngữ thế nào?
Học phần trọng tâm của ngoại ngữ thế nào?

Bây giờ, trong nghiên cứu ở trên của Davies, đây là nơi mà mọi thứ bắt đầu có được thực sự thú vị:
"Giả sử một người học ngôn ngữ hướng đến 90% mức độ bao trùm trong bốn phần của bài diễn văn thể hiện các lớp học mở - danh từ, động từ, tính từ và trạng từ. Con số 90% này sẽ thu được bằng cách biết về 2600 danh từ, 230 động từ, 980 tính từ, và 50 phó từ, hoặc tổng cộng khoảng 3800 mẫu.
 
Vì vậy, bạn có thể thấy rằng danh từ hoàn toàn chiếm ưu thế trong từ vựng nói chung (dữ liệu trên là từ lời nói, không phải viết hay tập văn), chiếm 2600 trong số 3800 lexemes, chiếm 68,4%, chiếm hơn hai phần ba của tất cả các lexemes được sử dụng. Tuy nhiên, bạn nên nhớ rằng mỗi động từ được tính là một lexeme bất kể nó được liên hợp như thế nào: vì vậy nói rằng bạn chỉ cần biết 230 động từ là một chút vô nghĩa khi bạn không chỉ phải biết từng động từ đó, bạn cũng phải 'biết' một nhóm các cách chia động từ khác nhau cho mỗi một (ví dụ như bạn không chỉ phải học 'ser', bạn phải học ‘soy’, ‘eres’, ‘es’, ‘somos’, ‘son’, ‘fui’, ‘fuiste’, ‘fue’, ‘sea’, ‘seamos’, ‘sean’, etc., etc., etc.)
 
Ngoài ra, họ cũng nhận thấy rằng một số từ có tần số sử dụng rất cao ở một trong ba thanh ghi (viết bằng lời, văn chương, văn học phi hư cấu) nhưng hầu như không xuất hiện ở hai phần còn lại, hoặc nó đã có mặt trong hai (typically both written registers) nhưng không có ở một trong những cái khác. Vì vậy, bạn sẽ thấy rằng có những từ rất xa để học hỏi nhiều hơn các từ khác nhau tùy thuộc vào registers mà bạn quan tâm nhất để trở nên thành thạo. 

...Còn nữa...

*Nguồn:  Internet
Tây Ban Nha