REPRODUCIBILITY LÀ GÌ
Bình luận Reproducibility Là Gì – Nghĩa Của Từ Reproducibility là ý tưởng trong nội dung bây giờ của blog Tiên Kiếm. Tđam mê khảo content để hiểu cụ thể nhé.
Bạn đang xem: Reproducibility là gì
Chú thích: Ngulặng bạn dạng bài viết này bàn về “reproducible research”, tại đây Shop chúng tôi trợ thời dịch là “phân tích khả lặp”, quan niệm cầm lược về “nghiên cứu và phân tích khả lặp” là nhiều loại phân tích kỹ thuật không chỉ có báo cáo công dụng nghiên cứu và phân tích Hơn nữa bao hàm không thiếu thốn các bước triển khai, mặt khác chào làng những thông tin cần thiết (tài liệu, thuật tân oán thực hiện,…) nhằm người khác có thể triển khai lại nghiên cứu và phân tích nhằm mục đích chứng thực tính đúng đắn cùng không ngừng mở rộng nghiên cứu và phân tích dựa vào gốc rễ nghiên cứu cũ. Ở phía trên “reproducible” tốt “reproducibility” với nghĩa có tác dụng lặp lại, có khả năng thực hiện lại nghiên cứu và phân tích đã có được công bố.
Quý khách hàng sẽ xem: Reproducibility là gì
Khoa học hiện giờ biết tới sẽ rơi vào cảnh cuộc rủi ro khủng hoảng về tài năng tái lặp. Khả năng tái lặp dường như được hoan nghênh với thường xuyên là nhân tố đề xuất đối với các nghiên cứu mang tính cộng đồng (ví dụ điển hình trên những tạp chí nhỏng nature tuyệt science). Luận điểm chung cho Xu thế này là việc những nghiên cứu có chức năng được triển khai lại một biện pháp chủ quyền thì sẽ có tính tin cẩn cao hơn hồ hết nghiên cứu và phân tích quan yếu triển khai lại một giải pháp độc lập. Cũng buộc phải lưu ý rằng nghiên cứu khả lặp không những có ý nghĩa xác minh, không những thế nữa nó đã mang về ích lợi thiết thực mang lại câu hỏi không ngừng mở rộng nghiên cứu tuyệt xây cất các phân tích tương tự. Khó có thể tìm thấy phần đa ý kiến bội phản chưng các vấn đề trên, tuy vậy phải xét tới thực tiễn rằng cùng với mỗi nhóm phân tích cũng cần phải đầu tư chi tiêu một nguồn lực cố định trong Việc làm cho cho những nghiên cứu và phân tích của họ phát triển thành khả lặp so với các công ty phân tích độc lập. Chẳng hạn bài toán tái diễn toàn cục phần lớn thí điểm trong chống thí điểm. Tuy nhiên cũng có nhiều biến đổi thể dễ dàng và đơn giản rộng, chẳng hạn như kỹ năng lặp lại so với dựa trên những bộ dữ liệu vẫn biết.
Các một số loại phân tích công nghệ không giống nhau đã khác nhau về tài năng tái lặp. Một ví dụ là nghiên cứu và phân tích toán thù học tập, trong tương đối nhiều ngôi trường hợp các nghiên cứu này chất nhận được Việc khả lặp dựa trên hồ hết pmùi hương trình vào phiên bản thảo. Một ví dụ không giống là những phân tích hiện trường, hay thì công dụng dựa vào vào các nhân tố không kiểm soát điều hành được. Chẳng hạn vấn đề tái lập toàn bộ một nghiên cứu và phân tích về ảnh hưởng của một cơn lốc ngay trước và sau khi nó xảy ra dường như là điều cấp thiết, ít nhất xét về tính kết quả của chính nó.
Phạm vi hiện giờ về khả năng tái lập vẫn chỗ nào kia giữa nhị ví dụ nhưng Shop chúng tôi chỉ ra rằng làm việc bên trên, với phạm vi này thu thon tuyệt không ngừng mở rộng phụ thuộc vào các bộ nguyên lý sẵn có cho các nhà nghiên cứu và phân tích. Phần mềm nguồn msinh sống, năng lượng điện toán thù đám mây, tàng trữ tài liệu và vô vàn các qui định năng lượng điện toán sẵn có sẽ không ngừng mở rộng phạm vi này vào câu hỏi chất nhận được các phân tích khả lặp hoàn toàn có thể được tiến hành bên trên các loại phân tích hơn hai ví dụ sống trên. Tuy nhiên, lối nghịch chữ về một cuộc khủng hoảng rủi ro của nghiên cứu khả lặp cho biết thêm rằng các cỗ lý lẽ hiện nay, tuy nhiên hết sức đặc trưng, tuy vậy chưa xử lý được vấn đề một phương pháp triệt nhằm.
Hiện tại Shop chúng tôi đã thao tác vào một dự án về một đối chiếu bao gồm cường độ tinh vi vừa đề nghị với 1 lượng dữ liệu cũng vừa cần (49061 dòng) cùng Shop chúng tôi vẫn thí điểm xem nhằm thay đổi nó thành một phân tích khả lặp trọn vẹn thì rất cần phải có tác dụng mọi gì. (Nghiên cứu vãn này trả lời cho 1 thắc mắc cực kỳ 1-1 giản: loại thân mộc chiếm tỉ lệ thành phần từng nào vào giới thực vật?). Kinh nghiệm của chúng tôi trong bài toán cố gắng đổi mới nghiên cứu và phân tích này biến hóa khả lặp rất có thể hữu ích đến số đông bàn bạc tiếp theo sau về kiểu cách làm cho gắng làm sao để những bên công nghệ đề xuất ít thời hạn cùng ít nguyên tố kỹ năng hơn chúng tôi để triển khai các nghiên cứu khả lặp của riêng họ. Nói phương pháp khác, vấn đề làm cho này cho biết thêm Shop chúng tôi hữu ích đến cả làm sao vào bài toán không ngừng mở rộng phạm vi khả lặp mang lại nhiều nhiều loại nghiên cứu và phân tích rộng với bằng phương pháp đó, khiến cho kỹ thuật ngày càng an toàn và đáng tin cậy hơn.
Cuối thuộc, đối chiếu và báo cáo của chúng tôi đã được tái lặp một bí quyết độc lập với kha khá dễ dàng mang đến phần nhiều ai ước ao tái lặp nghiên cứu và phân tích này, nhưng lại nhằm triển khai được việc tái lặp ở tầm mức độ này chưa phải là không cần vứt sức lực. Cho hồ hết ai quyên tâm, tổng thể mã lệnh với tư liệu của Shop chúng tôi tất cả sẵn tại khu vực này.
Có 2 phần nằm trong Việc phát triển thành một dự án công trình trlàm việc bắt buộc khả lặp: dữ liệu cùng những đối chiếu đã tiến hành. Chúng tôi cũng lưu ý rằng thực tiễn dự án này là khả thi vì chưng phần đông cải cách và phát triển cách đây không lâu vào bài toán tàng trữ dữ liệu. Công vấn đề viết một mã lệnh để sở hữu tài liệu thiết yếu trường đoản cú Dryad cùng sẵn sàng mang đến câu hỏi phân tích nó khá là đơn giản và dễ dàng. Tuy nhiên, vấn đề đó chỉ minh chứng một ban đầu cho thách thức: bước so sánh dữ liệu giờ đây biến hóa bước trở ngại độc nhất vô nhị. Những điều ngay lập tức tiếp theo là list nđính đều bài học rút ra tự trong thực tế thao tác của Cửa Hàng chúng tôi. Mỗi bài học kinh nghiệm cho thấy thêm một thách thức Cửa Hàng chúng tôi đề xuất vượt qua trong quy trình tiến hành phân tích khả lặp và công cụ Cửa Hàng chúng tôi lựa chọn nhằm tuyên chiến đối đầu và cạnh tranh với thách thức kia.
Những thách thức cùng hiện tượng cho Việc tái lặp
Sử dụng mối cung cấp dữ liệu tiêu chuẩn
Chúng tôi cài đặt dữ liệu về từ những mối cung cấp chuẩn (Dryad cùng The Plant List) và chỉ chỉnh sửa chúng áp dụng các câu lệnh nhằm bảo vệ các thay đổi bảo toàn được ngulặng vẹn đặc điểm của tài liệu lúc đầu. Lợi ích của những dữ liệu mngơi nghỉ đã chỉ được nhận biết nếu như bọn họ kính trọng tính định danh của tài liệu và không tạo nên hàng trăm phiên bản sửa đổi chỉ khác nhau tí đỉnh. Điều này cũng hỗ trợ cho bài toán ghi công của rất nhiều bạn đóng góp tài liệu. Tuy nhiên những sự việc nlỗi các tiêu chuẩn phân các loại chưa thống tốt nhất vẫn sẽ là một trong trang bị cản Khủng so với những tài liệu về sinh thái học.
Kết đúng theo lưu ý đến với mã lệnh
Chúng tôi sử dụng gói knitr cho R nhằm xúc tiến các phân tích theo phong cách thiết kế gồm lý giải. Toàn cỗ các phân tích, bao hàm phần nhiều biện giải cho những hàm cốt lõi rất có thể search thấy trên đây. Tuy nhiên, thao tác cùng với những team mã lệnh dài hay yêu cầu thời gian đáng kể để chạy vẫn sẽ là một trong những sự việc choáng váng.
Xem thêm: Moay Ơ Bánh Răng Là Gì ? Kiến Thức Cập Nhật Mới Nhất Mayơ Và Các Bộ Truyền
Kết xuất những thông số kỹ thuật động
Toàn bộ bài toán xử lí dữ liệu của chúng tôi được tiến hành vì chưng các mã lệnh, cùng chúng tôi rất có thể xóa hết các thông số cổng output cùng sản xuất lại bọn chúng một biện pháp dễ dãi.
Tự hễ tàng trữ các thành tố prúc thuộc
Chúng tôi áp dụng GNU make nhằm quản lý những thành tố phụ thuộc trong dự án công trình, chỉ thay đổi các phần nên sửa lại. Công chũm này cũng hỗ trợ cho quá trình cách tân và phát triển dự án đổi mới một quy trình tự gói gọn.
Quản lý phiên bản
Toàn bộ mã lệnh của Shop chúng tôi được làm chủ phiên phiên bản thực hiện git từ cơ hội bước đầu, vấn đề này được cho phép chúng tôi kiểm soát và điều hành các phiên bạn dạng cũ một giải pháp tiện lợi. Đây cũng chính là trung trọng điểm tài liệu của phần đa máy Cửa Hàng chúng tôi có tác dụng. Xem nội dung bài viết này để xem vai trò to lớn to của cai quản phiên bản tới quy trình nghiên cứu và phân tích.
Tự rượu cồn chất vấn các biến hóa nhằm bảo đảm an toàn ko tạo nên vấn đề
Chúng tôi áp dụng môi trường thiên nhiên hệ thống tích đúng theo thường xuyên (continuous integration) Travis CI để đo lường và thống kê biến đổi vào đối chiếu nhằm ngăn chặn lỗi. Mỗi khi công ty chúng tôi tạo thành một biến đổi, khối hệ thống này tải mã nguồn của công ty chúng tôi xuống đồng thời cùng với những tài liệu tương quan với chạy so với, cùng vẫn gửi mang đến công ty chúng tôi một thỏng năng lượng điện tử nếu do nguyên do nào đấy phân tích bị lỗi. Hệ thống này thậm chí còn còn cài lên các phiên bản đã biên dịch của so với cùng ghi crúc mỗi khi chạy.
Đóng gói những thành tố phụ thuộc
Chúng tôi thực hiện gói packrat đến R nhằm thống trị cùng tàng trữ những gói R dựa vào để chắc chắn khả năng khả lặp sau này. Về phương diện định hướng, vấn đề đó tức là nếu như phiên bạn dạng của gói ứng dụng kia đổi khác không ít tới nút gây ra lỗi vào mã lệnh của công ty chúng tôi thì chúng tôi sẽ bao gồm sẵn một bản lưu trữ có thể sử dụng được. Đây là 1 trong những công cụ mới, chúng tôi chưa xác nhận được nó bao gồm chuyển động hay không.
Những thử thách còn vứt ngỏ
Chúng tôi nhận ra rằng vấn đề đổi khác phần lớn phân tích sẽ chuyển động từ laptop của người này (cùng với phần nhiều cấu hình thiết lập cá thể đến máy tính xách tay của họ) quý phái fan không giống là một trong câu hỏi trở ngại. lấy ví dụ như vụ việc này. Thật cạnh tranh để dự đân oán được hầu hết nguyên nhân dẫn đến sai sót: trong quá trình tái lặp nghiên cứu và phân tích này vị Carl Boettiger một vụ việc vẫn tạo ra bởi vì bài toán không hoàn thiện tài liệu về những phiên bản gói hỗ trợ R cần thiết.Gói mã lệnh tiến hành những công việc bên trên là tương đương về kích cỡ lúc triển khai phân tích trong thực tế; đó là một thử thách thiệt sự cho những đơn vị nghiên cứu và phân tích. Việc sử dụng những ngôn từ cùng framework khác nhau làm tăng thêm đòi hỏi về những mảng kiến thức mang ý nghĩa kinh nghiệm rộng, cũng giống như kĩ năng xẩy ra những vụ việc đang tăng lên. Càng tự động hóa hóa quá trình này thì các nghiên cứu và phân tích khả lặp đang càng trnghỉ ngơi đề xuất phổ biến.
Phương thơm pháp tiếp cận thực hiện hệ thống tích thích hợp liên tiếp gồm tiềm năng lớn hỗ trợ cho bài toán thống trị những dự án công trình nghiên cứu dựa trên công nghệ điện toán trsinh sống yêu cầu dễ dãi rộng. Tuy nhiên, mặc dù phân tích của Shop chúng tôi mang tính cách thức nhiều hơn là áp dụng thực tế, nó sẽ ảnh hưởng giới hạn sinh sống các mặt: yên cầu dự án công trình bắt buộc là nguồn mnghỉ ngơi, so với buộc phải chạy kha khá nkhô hanh (dưới 1 giờ). Những số lượng giới hạn này là hợp lý và phải chăng so với những hình thức dịch vụ miễn mức giá tuy vậy nó sẽ không thể đáp ứng được các dự án công trình nghiên cứu và phân tích thực hiện các biết tin “nhạy cảm” với những tính tân oán hoàn toàn có thể kéo dãn dài các giờ đồng hồ hay các ngày.
Chúng tôi nhận biết mục tiêu khả lặp đến dự án công trình đã trở thành một ví dụ có lợi, với nó đã trở thành nền tảng cho các dự án công trình tiếp theo. Tuy nhiên, quá trình này vẫn trsinh sống bắt buộc thức tạp rộng các, để cho việc hướng dẫn cho người không giống cách để làm cho dự án công trình của mình trsinh hoạt đề xuất tái lặp ko đơn giản dễ dàng chỉ qua lời nói.Chúng ta cần phải cải cách và phát triển gần như lý lẽ, tối thiểu buộc phải dễ dùng như quản lý phiên bản trước khi bọn họ muốn chờ bài toán tái lặp dự án công trình đổi thay một Xu thế phổ biến.Chúng tôi ko phản nghịch bác chủ ý của Titus Brown về Việc tái lặp một phần thì giỏi hơn là không tái lặp gì cả (một nửa số bạn khiến cho các bước của họ có khả năng tái lặp 50% có vẻ tốt hơn 5% số bạn làm cho côgn vấn đề của họ có khả năng tái lặp 100%!). Tuy nhiên, Shop chúng tôi ko đống ý cùng với ý kiến của Titus nhận định rằng đều lý lẽ bắt đầu là không cần thiết. Những nguyên lý bây giờ là khôn xiết cổ hủ với nhiều đến nút khó mong đợi những đơn vị khoa học áp dụng bên trên diện rộng xu hướng tái lặp bởi mục tiêu bao gồm của họ chưa hẳn nhằm tái lặp. Nếu nhận định rằng vấn đề tái lặp là không thu hút, bọn họ tất yêu trông chờ người khác bỏ thời hạn với sức lực của họ ra để góp phần cho cộng đồng những vật dụng tốt đẹp.
Những nỗ lực cố gắng không giống cho mục tiêu đơn giản là thực hiện lại nghiên cứu và phân tích tại một máy tính không giống cũng không khả thi hơn nỗ lực của Shop chúng tôi là bao. Một phân tích của tập thể nhóm UBC Reproducibility cho thấy bọn họ chẳng thể tái lặp tác dụng của 30% phần nhiều phân tích được chào làng thực hiện gói hỗ trợ phổ biến STRUCTURE, cùng với thuộc dữ liệu được hỗ trợ vì chưng tác giả. Một ngôi trường vừa lòng xứng đáng ảm đạm hơn, một đội nghiên cứu trên ĐH Arizona cho biết thêm chúng ta chỉ hoàn toàn có thể build được khoảng chừng 50% số phần mềm nguồn mở mà người ta có thể mua xuống mà chưa xét tới câu hỏi soát sổ khả năng của phần mềm (để ý rằng nghiên cứu và phân tích này bây giờ đã được tái lặp!).
Xem thêm: Quy Hoạch Chi Tiết Khu Quy Hoạch Bàu Vá Huế, Nhếch Nhác Khu Quy Hoạch Bàu Vá
Quá trình tạo nên phân tích của Cửa Hàng chúng tôi trlàm việc cần khả lặp cho biết chúng ta chỉ đã tiến được đều bước nhỏ tuổi vào Việc tạo nên nghiên cứu và phân tích khả lặp trsinh sống buộc phải thông dụng đối với các bên công nghệ trong thực tiễn.