Đang tải...
 
Skip to main content

Bài kiểm tra tiếng Anh xấu Phá hủy cuộc sống - Bài kiểm tra tiếng Anh và TOEFL Pearson

Bài viết này còn sơ khai.

Có rất nhiều tài nguyên tham khảo ở đây - chúng được đóng góp bởi cộng đồng. Khi bạn học, chúng tôi mời bạn quay lại và cập nhật các trang này - chia sẻ những gì bạn đã học được.


Hãy giúp "Trăm triệu thầy, trăm triệu trò" hoàn chỉnh nội dung để những người khác có thể hưởng lợi từ nó trong tương lai.

Tìm hiểu cách Đóng Góp


Bên dưới là "nội dung thô" phục vụ tìm kiếm

- Bấm Ctrl + F : nhập từ khoá (tìm trên trang hiện tại).
- Nhập trực tiếp vào ô tìm kiếm trên cùng (tìm trên toàn bộ website).

"nội dung thô" được tạo tự động, giúp bạn "tìm kiếm" dễ hơn bằng cách gõ "từ khóa". Nó sẽ tồn tại đến khi Ai đó học và giúp hoàn chỉnh nội dung.


00:00
nhắm mắt lại một lúc và tưởng tượng rằng bạn đang rất phấn khích, phấn khích về
tương lai vì bạn sắp bắt đầu một cuộc sống mới ở một đất nước mới, điều duy nhất
ngăn cách bạn và cuộc sống mới đó
là một kỳ thi tiếng Anh, nhưng đó không phải là
vấn đề vì bạn là người bản ngữ nói tiếng Anh và cũng là một học giả có hai
bằng đại học, vì vậy bạn làm bài kiểm tra và không nghĩ gì thêm nữa,
nhưng rồi bạn nhận được kết quả và bạn bị sốc khi phát hiện ra rằng mình đã
trượt kỳ thi tiếng Anh và bạn tự hỏi điều này có thể xảy ra như thế nào
nhưng không chỉ có thể xảy ra mà còn là một câu chuyện có thật.

00:01
Bác sĩ thú y người Ireland Lewis Kennedy, người bản ngữ nói tiếng Anh với hai
bằng đại học, đã trượt phần thi năng lực nói của Bài kiểm tra
tiếng Anh Pearson và điều đó có thể xảy ra vì không
một con người nào tham gia vào quá trình đánh giá tiếng Anh của cô ấy,
tất cả đều được thực hiện bởi máy tính và đây là một
ví dụ đáng lo ngại về cách các trường đại học và chính phủ trên khắp thế giới
cho phép các công ty tư nhân kiếm được hàng triệu đô la, đồng thời quyết định
tương lai của những người bình thường dựa trên
khoa học đáng ngờ và đạo đức đáng ngờ. Hãy cùng xem xét thế giới của
các bài kiểm tra tiếng Anh tự động, điều đầu tiên chúng ta cần nói đến là

00:02
các kỳ thi này có sức mạnh như thế nào, chúng được
chấp nhận bởi hàng ngàn trường đại học trên toàn thế giới bao gồm Harvard và
Cambridge và chúng cũng được Chính phủ Hoa Kỳ, Anh, Canada và Úc chấp nhận cho
mục đích thị thực và nhập cư, chúng là
các bài kiểm tra hoàn toàn trên máy tính và được chấm điểm
bằng trí tuệ nhân tạo AI và đây là một trong những điểm bán hàng chính của
kỳ thi, ví dụ theo các trang web Pearson và TOEFL,
các video YouTube và tài liệu tiếp thị của họ,
đây là lý do tại sao các kỳ thi này lại
tuyệt vời đến vậy, điều này được giải thích chi tiết hơn trên trang web Pearson

00:03
do các quy trình và Công nghệ của chúng tôi, máy tính hoạt động như một
giám khảo chuyên gia nhưng không có bất kỳ sự
thiên vị nào, thiếu sự tập trung hoặc sự khác biệt
giữa các giám khảo riêng lẻ, đây là một
chiêu trò bán hàng tuyệt vời và trên bề mặt,
có vẻ hợp lý khi máy tính không đánh giá, vì vậy một
kỳ thi do máy tính hỗ trợ bằng trí tuệ nhân tạo là cách công bằng nhất để
đánh giá khách quan tiếng Anh của bạn thật tuyệt
nhưng vấn đề là đó hoàn toàn là lời nói dối, thực tế có khả năng các kỳ thi này
là cách thiên vị và không công bằng nhất để
đánh giá tiếng Anh của bạn, hãy để tôi giải thích tại sao
đúng là máy tính không đánh giá, tất cả những gì

00:04
chúng làm là chúng làm theo các hướng dẫn mà con người đưa ra và đây là
gốc rễ của vấn đề, con người, con người
đôi khi có thành kiến ​​một cách công khai và
có ý thức nhưng phần lớn con người có thành kiến ​​một
cách vô thức, vì vậy khi chúng ta tạo ra
các chương trình máy tính này, chúng ta đưa ra những thành kiến ​​của mình và
sau đó trí tuệ nhân tạo xuất hiện và khiến vấn đề trở nên tồi tệ hơn, nó
khuếch đại những thành kiến ​​đó. Sự
khuếch đại thành kiến ​​trong học máy là một vấn đề đã biết và là một
vấn đề rất khó giải quyết và một số công ty tiên tiến nhất trên thế giới đã
trở thành nạn nhân vào tháng 3 năm 2016. Microsoft
đã ra mắt một bot trò chuyện trên Twitter được thiết kế

00:05
để có các cuộc trò chuyện với AI và chỉ trong vòng vài
giờ, nó đã đăng ngôn ngữ phân biệt chủng tộc, kỳ thị người đồng
tính và kỳ thị phụ nữ vào tháng 11 năm 2018, người ta phát hiện ra rằng Google Dịch có thái độ kỳ thị phụ nữ khi chọn đại từ nam cho bác sĩ và những người làm việc chăm chỉ và
đại từ nữ cho y tá và những người lười biếng vào
tháng 10 năm 2018. Amazon đã đóng cửa
trợ lý tuyển dụng AI của mình sau khi nó được
chứng minh là phân biệt giới tính và trong một
ví dụ nghiêm trọng hơn, phần mềm AI do
chính phủ Hoa Kỳ sử dụng đã dự đoán sai rằng người da đen có khả năng
phạm tội trong tương lai cao hơn 77% so với người da trắng. Vậy tất cả
những thành kiến ​​này đến từ đâu? Chúng đến từ

00:06
dữ liệu đầu vào từ con người và sau đó AI đã tiếp thu những thành kiến ​​đó và
khuếch đại chúng, vì vậy hãy nói rằng chỉ
vì một bài kiểm tra được hỗ trợ bởi AI mà
không có bất kỳ sự thiên vị nào có thể là sự
lừa dối thuần túy được rồi chúng ta hãy bắt đầu hỏi một số
câu hỏi thực sự quan trọng câu hỏi đầu tiên là chúng
ta có bằng chứng nào cho thấy ví dụ như tuyên bố của Pearson là đúng rằng đây
là bài kiểm tra tiếng Anh không thiên vị nhất may mắn là Pearson đã công khai
nhiều nghiên cứu miễn phí trên trang web của họ để chúng ta có thể tự
đánh giá các tuyên bố của họ vậy hãy cùng
xem một số nghiên cứu ở đây vì vậy nghiên cứu này ở đây đã được Pearson công bố

00:07
và nó không được bình duyệt ngang hàng giống như nghiên cứu này ở đây do
Pearson công bố ah được bình duyệt ngang hàng giống như nghiên cứu này ở đây một
lần nữa do Pearson công bố không được bình duyệt ngang hàng được rồi vì
vậy đây là một nghiên cứu do Đại học Macquarie và Úc công bố và được
Pearson trả tiền nhưng dù sao chúng ta hãy cùng
xem hmm vì vậy nó thực sự cho thấy
các nhà nghiên cứu đã tìm thấy sự thiên vị trong
bài kiểm tra tiếng Anh của Pearson nhưng Pearson
không thể cung cấp thêm thông tin cho các nhà nghiên cứu
về lý do tại sao vì lý do bảo mật hãy nhớ rằng đây là một bài kiểm tra mà họ
tuyên bố là không có bất kỳ sự thiên vị nào được rồi chúng

00:08
ta hãy cùng xem bên ngoài trang web của Pearson để biết một số
nghiên cứu được bình duyệt ngang hàng độc lập cho thấy liệu
kỳ thi có thực sự là không thiên vị và công bằng không có gì
và đây là điều đầu tiên khiến bất kỳ ai thực sự quan tâm đến
sự công bằng và bình đẳng lo lắng các trường đại học và
chính phủ trên toàn thế giới trao quyền
kiểm soát cuộc sống của những người dân thường cho các công ty tư nhân
dựa trên những tuyên bố tiếp thị chưa được chứng minh và

00:09
không thể kiểm chứng được được rồi chúng ta hãy hỏi một câu hỏi thực sự quan trọng khác những người đào tạo thuật toán này là ai và làm sao chúng ta biết rằng họ không thiên vị may mắn là Pearson đã
thực sự cung cấp rất nhiều chi tiết về cách họ ban đầu đào tạo
thuật toán của mình trong bài báo này trên trang web của họ
và đây là nơi mọi thứ trở nên thực sự thú vị
nếu bạn muốn hệ thống AI của mình chấm điểm tiếng Anh giống như con người
thì bạn cần đào tạo nó bằng cách sử dụng con người

00:10
những gì bạn làm là bạn yêu cầu mọi người đánh giá
tiếng Anh tốt hay xấu hoặc trung cấp và
sau đó bạn đưa thông tin đó vào máy tính và bạn nói đây là một ví dụ về
tiếng Anh tốt đây là một ví dụ về tiếng Anh tệ và bạn lặp lại điều đó hàng trăm
nghìn lần với hàng nghìn triệu bài làm của sinh viên và
cũng với rất nhiều người chấm điểm là con người
và đó chính xác là những gì Pearson đã làm khi họ ban đầu đào tạo
thuật toán của mình họ đã sử dụng bảy giám sát viên
và 95 người đánh giá chuyên gia bảy
giám sát viên này có năm người đến từ Vương quốc Anh và
hai người đến từ Hoa Kỳ và 95 người đánh giá này
một lần nữa có 80 người từ Vương quốc Anh và 15 người từ
Hoa Kỳ, đây là những người quyết định

00:11
tiếng Anh nào là tốt và tiếng Anh nào là tệ nhưng đây là vấn đề mà những
người đánh giá này phải đồng ý với bảy
người giám sát này 80% thời gian hoặc họ sẽ bị
loại khỏi chương trình, điều đó về cơ bản có nghĩa là tất cả các khóa đào tạo về
trí tuệ nhân tạo của Pearson đều do
bảy người quyết định, năm người từ Vương quốc Anh và hai người
từ Hoa Kỳ trong một kỳ thi mà không có bất kỳ sự thiên
vị nào có thể xảy ra, nhưng hãy lùi lại một bước và đặt một câu hỏi lớn hơn,

00:12
AI giỏi lắng nghe và hiểu đến mức nào, câu trả lời không tốt lắm, trước tiên
hãy xem xét phần nghe, bây giờ hãy nhớ
rằng các kỳ thi này hoàn toàn dựa trên máy tính, điều
đó có nghĩa là họ cần sử dụng công nghệ nhận dạng giọng nói để chấm điểm
tiếng Anh của bạn. Trang web của Pearson nói rằng điều này có nghĩa là bạn
chỉ được chấm điểm dựa trên những gì bạn nói chứ không phải giọng của bạn hoặc
bất kỳ điều gì khác. Bây giờ, bất kỳ ai đã sử dụng
trợ lý giọng nói như Trợ lý Google hoặc
Alexa hoặc Siri đều biết nó tệ đến mức nào, ý tôi là ngay cả trong
điều kiện hoàn hảo, không có tiếng ồn xung quanh, tôi nói chậm và rõ ràng,
sử dụng tiếng Anh chuẩn. thường gặp vấn đề lớn trong giao tiếp nhưng hãy nhớ

00:13
rằng những người tham gia các kỳ thi này không phải là người bản ngữ và họ cũng
sử dụng tiếng Anh không chuẩn và giọng địa phương hãy cùng xem
nghiên cứu cho chúng ta biết điều gì về trạng thái
nhận dạng giọng nói vào năm 2018 global me đã
thử nghiệm 70 lệnh khác nhau bằng loa thông minh và họ phát hiện ra rằng
độ chính xác trung bình là 83% đối với Google home
và 86% đối với Amazon echo với sự khác biệt rất lớn về độ chính xác giữa người
bản ngữ và người không phải bản ngữ một lần nữa
tất cả là về sự thiên vị của con người và những người
được sử dụng để đào tạo AI vậy ai có cơ hội thành công nhất với
nhận dạng giọng nói Người Mỹ thuộc tầng lớp trung lưu thượng lưu có trình độ học vấn cao của White

00:14
có lẽ đến từ bờ biển phía tây chính xác là kiểu
người đang tham gia các kỳ thi tiếng Anh
ngay bây giờ những gã khổng lồ công nghệ này đang chi
10% ngân sách nghiên cứu và phát triển của họ cho nhận dạng giọng nói
tổng cộng khoảng 5 tỷ đô la hãy tự hỏi liệu Pearson hoặc TOEFL
có khả năng nhận dạng giọng nói tốt hơn Google hoặc Apple hoặc Amazon không
bạn có để Siri hoặc Alexa hoặc
trợ lý Google quyết định tương lai của bạn không và liệu có
thực sự đạo đức hay công bằng khi các trường đại học và chính phủ sử dụng loại
công nghệ này để quyết định tương lai của mọi người

00:15
ngay bây giờ không hãy cùng xem phần thứ hai để
hiểu AI giỏi như thế nào trong việc hiểu ý nghĩa của ngôn ngữ
theo Pearson, họ sử dụng một công nghệ gọi là
Người đánh giá thông minh và phần đầu của kỳ thi sử dụng một
người đánh giá và nghiên cứu cho thấy các hệ thống này tương quan với nhau và
chúng cũng tương quan với những người đánh giá là chuyên gia, điều
đó có nghĩa là họ thường đồng ý về tiếng Anh tốt và tiếng Anh tệ nhưng
có một vấn đề là các hệ thống AI này
thực sự không hiểu ý nghĩa, tất cả những gì chúng có thể làm là xem các từ bạn
viết liên quan đến nhau như thế nào và dựa trên

00:16
đó, chúng có thể cho điểm nên chúng không biết sự khác biệt giữa
tiếng Anh có ý nghĩa thực sự và hoàn toàn vô nghĩa nên
chúng có thể rất dễ bị lừa, tiến sĩ. Les
Perelman từ MIT đã rất tức giận về việc
sử dụng chấm điểm tự động, thưa ông, đến nỗi
ông đã viết một chương trình máy tính có tên là Babel, về cơ bản, bạn nhập ba
từ khóa và chỉ cần nhấp vào một nút, nó sẽ tạo ra một bài luận, bài luận đó
hoàn toàn vô nghĩa nhưng vì nó sử dụng đúng loại từ nên bạn có thể sử dụng nó
để đạt điểm hoàn hảo trong
các bài kiểm tra được chấm điểm tự động và vì sách trắng của Pearson
dường như gợi ý rằng phần nói của kỳ thi thực sự không xem xét
nội dung nói của bạn mà chỉ xem xét âm thanh giọng nói của bạn nên có khả năng

00:17
nếu bạn nói nhảm với đúng loại ngữ điệu, bạn cũng có thể đạt
điểm nói hoàn hảo và có một điều cuối cùng về việc loại bỏ con người khỏi
phương trình, đó là giao tiếp phi ngôn ngữ những thứ như
biểu cảm khuôn mặt cử chỉ tay ánh mắt tư thế tất cả những điều này đều
cần thiết cho giao tiếp tốt và các
loại kỳ thi này không xem xét bất kỳ điều nào trong số
chúng. Bây giờ có vẻ không công bằng khi tôi chọn các kỳ thi cụ thể khi có
những kỳ thi khác cung cấp một sản phẩm tương tự như ion nhưng ít nhất
những kỳ thi đó còn lâu mới hoàn hảo nhưng vẫn tử tế cung cấp một

00:18
điều mà ngôn ngữ đòi hỏi ở con người Tôi muốn kết thúc bằng cách nói về
một câu hỏi lớn hơn nhiều đó là tính hữu ích và đạo đức của cách
chúng ta sử dụng kết quả kỳ thi này những người
muốn sử dụng những kết quả này như một rào cản để vào đại học thích
nói về mối tương quan giữa kết quả kỳ thi tiếng Anh cao và điểm trung bình cao
vấn đề là điều đó không chỉ không đúng mà còn sai về mặt logic nếu có mối
tương quan giữa điểm số của bạn và trình độ tiếng Anh của bạn thì tất cả
người bản ngữ sẽ tốt nghiệp Đại học với số điểm hoàn hảo và tất
nhiên là không và logic tương tự cũng áp dụng cho những người muốn sử dụng những
kỳ thi này như một rào cản nhập cư
một lần nữa nếu trình độ tiếng Anh của bạn cho thấy

00:19
bạn là người như thế nào thì chúng ta sẽ không có người bản ngữ nào là
tội phạm hoặc lười biếng hoặc ngu ngốc khi rõ ràng là không phải vậy tôi tự hỏi
liệu các giám đốc điều hành, nhân viên và quản trị viên của các
công ty kiểm tra, trường đại học và chính phủ này có sẵn sàng đặt
tương lai của họ vào vòng nguy hiểm dựa trên
kết quả của loại kỳ thi này không tôi nghĩ điều quan trọng là mọi tổ chức công
hay tư thực sự dành một chút thời gian để suy nghĩ về ý nghĩa của việc có
tương lai và ý nghĩa của việc tước đi tương lai của ai đó chỉ vì
máy tính nói không tôi là người theo đạo Thiên chúa đây là

00:20
tiếng Anh kiểu Kangaroo tôi sẽ gặp lại bạn trong lớp