Chuyển đổi số trong phát triển tài nguyên thông tin khoa học và công nghệ số
NGHIÊN CỨU-TRAO ĐỔI
CHUYỂN ĐỔI SỐ TRONG PHÁT TRIỂN
TÀI NGUYÊN THÔNG TIN KHOA HỌC VÀ CÔNG NGHỆ SỐ
ThS Cao Minh Kiểm
Tổng thư ký Hội Thông tin khoa học và công nghệ Việt Nam
● Tóm tắt: Giới thiệu khái niệm chuyển đổi số và một số khía cạnh chuyển đổi số trong phát triển,
chia sẻ tài nguyên thông tin số khoa học và công nghệ.
● Từ khóa: Chuyển đổi số; tài nguyên thông tin; thông tin khoa học và công nghệ.
DIGITAL TRANSFORMATION IN THE DEVELOPMENT
OF DIGITAL INFORMATION RESOURCES ON SCIENCE AND TECHNOLOGY
● Abstract: To introduce the concept of digital transformation and some aspects of digital
transformation in developing and sharing digital information resources on science and technology.
● Keywords: Digital transformation; information resources; science and technology information.
Mở đầu
quan trọng của hoạt động thông tin KH&CN
và cần được quan tâm phát triển trong bối
cảnh chuyển đổi số quốc gia và chuyển đổi
số trong lĩnh vực thông tin KH&CN.
Cuộc Cách mạng công nghiệp lần thứ 4,
thường được gọi là Cách mạng công nghiệp
4.0 (CMCN 4.0), đang diễn ra trên thế giới
và đang làm thay đổi căn bản nền sản xuất
của thế giới. Đây là cuộc cách mạng công
nghiệp dựa trên công nghệ số mà nền tảng
là tích hợp cao độ hệ thống kết nối số hóa -
vật lý - sinh học với sự phát triển của internet
kết nối vạn vật (IoT), dữ liệu lớn (Big data),
Bài viết này giới thiệu khái niệm chuyển
đổi số và một số khía cạnh chuyển đổi số
trong phát triển, chia sẻ tài nguyên thông tin
số KH&CN.
1. KHÁI QUÁT VỀ CHUYỂN ĐỔI SỐ
trí tuệ nhân tạo (AI). CMCN 4.0 có tác động 1.1. Khái niệm chuyển đổi số
mạnh mẽ đến sự chuyển đổi của toàn bộ
Hiện nay, chưa có định nghĩa thống nhất
hệ thống, các quốc gia, các doanh nghiệp,
các ngành công nghiệp và toàn xã hội. Để
CMCN 4.0 được thực hiện thành công, các
nước trên thế giới phải thực hiện “Chuyển
đổi số” (Digital transformation). Việc chuyển
đổi số sẽ làm thay đổi công nghệ, biến đổi
hoạt động sản xuất - kinh doanh, thay đổi
các hoạt động xã hội. Gần đây, Chính phủ
đã yêu cầu Bộ Thông tin và Truyền thông
xây dựng và trình Chính phủ Đề án chuyển
đổi số quốc gia (1) để đẩy mạnh chuyển đổi
số ở Việt Nam. Một trong những nội dung
của dự thảo đề án là phát triển tài nguyên dữ
về chuyển đổi số (Digital transformation).
Định nghĩa trên Wikipedia cho rằng, chuyển
đổi số là việc sử dụng những công nghệ số
mới và thay đổi nhanh chóng để giải quyết
các vấn đề, thường bằng điện toán đám
mây, giảm sự phụ thuộc vào phần cứng do
khách hàng sở hữu nhưng nâng cao việc sử
dụng các dịch vụ dựa trên điện toán đám
mây [Wikipedia]. Công ty tư vấn hàng đầu
thế giới Garner cho rằng, chuyển đổi số
có nội hàm khác nhau tùy thuộc vào ngữ
cảnh. Nó có thể đề cập đến mọi việc từ
hiện đại hóa công nghệ thông tin (như điện
liệu quốc gia. Việc phát triển và chia sẻ tài toán đám mây) đến tối ưu hóa số (digital
optimization), hay sáng tạo ra mô hình
nguyên thông tin KH&CN là một khía cạnh
moi-nhat.aspx?Type_CSDL=KETQUANHIEMVU
THÔNG TIN VÀ TƯ LIỆU - 1/2020 17
NGHIÊN CỨU-TRAO ĐỔI
kinh doanh số mới. Trong lĩnh vực các tổ
chức công, chuyển đổi số cũng có thể liên
quan đến những sáng kiến khiêm tốn như
thực hiện các dịch vụ công trực tuyến hoặc
hiện đại hóa di sản (legacy modernization)
[Gartner IT Glossary]. Theo Garner, thuật
ngữ “chuyển đổi kinh doanh số” (digital
business transformation) có thể được hiểu
là việc sử dụng các công nghệ số để thay
đổi mô hình kinh doanh và tạo ra cơ hội
doanh thu và giá trị mới [trích theo Cục Tin
học hóa, 2018; Gartner IT Glossary].
Số hóa (Digitization) là quá trình chuyển
đổi từ dạng tương tự sang dạng số (dạng số
hóa). Thực chất số hóa là quá trình chuyển
đổi những thông tin trên những đối tượng
thực sang dạng điện tử hay còn gọi là dạng
số. Những đối tượng thực chứa thông tin có
thể là các tài liệu dạng văn bản, hình ảnh,
bản đồ, băng ghi âm, ghi hình,… trên các vật
mang tin vật lý (trên giấy, trên phim, giấy
ảnh, vi hình, băng ghi âm băng ghi hình,...).
Kết quả của số hóa là những đối tượng thực
được chuyển sang đối tượng số dưới hình
thức tệp tin. Mục đích của số hoá có thể là:
tăng cường sự truy cập đến tài nguyên thông
tin; cải thiện chất lượng dịch vụ cho những
người dùng tin thông qua khả năng truy cập
được cải thiện; giảm việc tiếp xúc trực tiếp
đến những tài nguyên quý, hiếm, cổ hoặc
được sử dụng nhiều; tạo ra bản sao lưu trữ;
cho phép cơ quan, đơn vị phát triển hạ tầng
kỹ thuật và kỹ năng của nhân viên; phát
triển khả năng chia sẻ tài nguyên thông tin
[IFLA, 2002]. Nói một cách đơn giản, số hóa
mới chỉ là việc chuyển từ dạng giấy sang
định dạng số (digital format). Ngày nay,
trong hoạt động thông tin thư viện, với việc
ứng dụng công nghệ thông tin, nhiều thông
tin đã được tạo lập ở dạng số ngay từ đầu
mà không cần phải trải qua công đoạn số
hóa. Vì thế, số hóa cũng có thể được hiểu
rộng hơn: đó là quá trình tạo lập thông tin/
dữ liệu số, có thể là thông qua việc chuyển
đổi từ dạng vật lý (tương tự) sang dạng số
hoặc đã là ở dạng số ngay từ khi được tạo
ra (digital born).
Như vậy, có thể thấy rằng, chuyển đổi
số là một sự chuyển đổi mạnh mẽ các hoạt
động, quá trình, mô hình và hiểu biết về
kinh doanh và tổ chức để tận dụng triệt để
những thay đổi và cơ hội của sự kết hợp các
công nghệ kỹ thuật số và tác động tăng tốc
của chúng trên toàn xã hội theo cách chiến
lược và ưu tiên, với những thay đổi hiện tại
và tương lai [i-SCOOP].
Hiện nay ở Việt Nam, chúng ta có thể
thống nhất với định nghĩa của Bộ Thông tin
và Truyền thông rằng “Chuyển đổi số được
hiểu là việc sử dụng dữ liệu và công nghệ
số để thay đổi một cách tổng thể và toàn
diện tất cả các khía cạnh của đời sống kinh
tế - xã hội, tái định hình cách chúng ta sống,
làm việc và liên hệ với nhau” [Bộ TT&TT,
2019]. Như vậy, chuyển đổi số có sự liên hệ
chặt chẽ với thông tin/dữ liệu số, các công
nghệ số và việc ứng dụng chúng một cách
mạnh mẽ trong mọi hoạt động của cơ quan,
tổ chức và cả quy mô quốc gia.
Theo Gartner, Digitalization (tạm dịch là
số hóa hoạt động) (2) là việc sử dụng các
côngnghệsốđểthayđổimôhìnhkinhdoanh
và cung cấp những cơ hội tạo ra giá trị và
doanh thu mới; đó là quá trình chuyển sang
kinh doanh số [Gartner Glossary]. Anna
Igniger (2017) cho rằng, “digitalization” là
1.2. Sự khác biệt giữa “Số hóa”, “Số hóa
hoạt động” và “Chuyển đổi số”
Chuyển đổi số không đơn thuần chỉ là
việc số hóa, tạo ra dữ liệu số hoặc việc ứng
dụng công nghệ thông tin (công nghệ số)
vào các hoạt động. Thực tế, chuyển đổi số
có sự khác biệt với số hóa (digitization) và quá trình làm cho thông tin số có giá trị cho
số hóa hoạt động (digitalization) [i-SCOOP;
Igniger Anna, 2017].
con người và coi đó là quá trình xem xét sao
cho áp dụng tốt nhất thông tin số/số hóa
2. Cũng có tài liệu gọi là “số hóa”
18 THÔNG TIN VÀ TƯ LIỆU - 1/2020
NGHIÊN CỨU-TRAO ĐỔI
để đơn giản hóa mọi hoạt động. Trong kinh về toán) đã tổng kết một công thức thể hiện
doanh, ứng dụng số thường đề cập đến việc định nghĩa chuyển đổi số [Hồ Tú Bảo, 2018]:
cho phép, cải thiện và/hoặc chuyển đổi các
hoạt động kinh doanh và/hoặc chức năng
Chuyển đổi số = Số hóa + Công nghệ số
Như vậy, chuyển đổi số không chỉ đơn
thuần là việc số hóa, tạo lập tài nguyên dữ
liệu số mà là bao gồm việc chuyển đổi sâu
sắc quá trình tạo lập thông tin số bằng việc
ứng dụng các công nghệ số, hình thành và
phát triển những dịch vụ mới, tạo ra giá trị
gia tăng từ tài nguyên số bằng việc sử dụng
những công nghệ số tiên tiến.
kinh doanh và/hoặc mô hình/quy trình và/
hoặc hoạt động kinh doanh bằng cách tận
dụng các công nghệ kỹ thuật số, sử dụng
rộng rãi hơn dữ liệu số, được chuyển thành
hành động, kiến thức cho mục đích cụ thể
[i-SCOOP]. Nói tóm lại, “digitalization” được
hiểu là việc sử dụng công nghệ số (digital
technologies) và dữ liệu (được số hóa hoặc
là dạng số ngay từ đầu (digital-born hay
natively digital)) để tạo ra doanh thu, cải
thiện kinh doanh, thay thế/chuyển đổi quá
trình kinh doanh (không chỉ đơn giản là số
hóa nó) và tạo ra môi trường kinh doanh số,
trong đó thông tin/dữ liệu số là then chốt.
“Digitalization” sẽ dẫn đến kinh doanh/hoạt
động số, còn chuyển đổi số đòi hỏi kinh
doanh số và số hóa.
1.3. Hạ tầng dữ liệu có vai trò quan trọng
trong chuyển đổi số
Để thực hiện chuyển đổi số, cần đảm
bảo các yếu tố nền tảng (hạ tầng), bao gồm
[Bộ Thông tin và Truyền thông, 2019]:
- Hạ tầng số (phát triển mạng di động
thế hệ mới, kết nối cáp quang đến các gia
đình, doanh nghiệp, cung cấp wifi miễn phí
tại khu vực công cộng, phát triển điện toán
đám mây- cloud computing, hạ tầng IoT,
BigData,…);
Chuyển đổi số là sự chuyển đổi sâu sắc
và tăng tốc các hoạt động, quy trình, năng lực
và mô hình kinh doanh để tận dụng triệt để
những thay đổi và cơ hội của công nghệ số
và tác động của chúng trên toàn xã hội theo
cách chiến lược và ưu tiên [i-SCOOP]. Đó là
quá trình tạo lập, phát triển ra các ứng dụng
kinh doanh mới tích hợp tất cả dữ liệu số và
- Nhân lực có kỹ năng số (digital skills);
- Nghiên cứu và phát triển công nghệ
số mới;
- Xây dựng môi trường pháp lý để bảo
các ứng dụng số này [Irniger Anna, 2017]. đảm môi trường an toàn, tin cậy, thúc đẩy
Giáo sư Hồ Tú Bảo (Viện nghiên cứu cao cấp chuyển đổi số.
Pháp lý
Hình 1. Thành phần của hạ tầng số (Nguồn: Hồ Tú Bảo, 2018)
Trong hạ tầng số, hạ tầng dữ liệu đóng liệu; những ứng dụng; các quy định pháp lý
vai trò then chốt, quyết định đến chuyển
đổi số [Cục Tin học hóa, 2018; Hồ Tú Bảo,
2018]. Những thành phần cơ bản của hạ
tầng số bao gồm: hạ tầng thiết bị,hạ tầng
và nhân lực (Hình 1).
Có thể cho rằng, dữ liệu trong hoạt động
thông tin KH&CN chính là tài nguyên thông
kết nối (các mạng truyền thông), hạ tầng dữ tin KH&CN số. Như vậy, phát triển và chia
THÔNG TIN VÀ TƯ LIỆU - 1/2020 19
NGHIÊN CỨU-TRAO ĐỔI
sẻ tài nguyên thông tin KH&CN số đóng vai thông tin điện tử; tài liệu thống kê KH&CN;
trò cốt lõi trong chuyển đổi số trong hoạt tài liệu đa phương tiện và tài liệu trên các
động thông tin KH&CN.
2. KHÁI QUÁT VỀ TÀI NGUYÊN THÔNG TIN KHOA
HỌC VÀ CÔNG NGHỆ SỐ Ở VIỆT NAM
vật mang tin khác” (4). Như vậy, tài nguyên
tin KH&CN là toàn bộ thông tin KH&CN
được ghi lại, trình bày hoặc thể hiện ở nhiều
dạng thức và trên nhiều dạng vật mang tin
(ở dạng truyền thống và dạng điện tử) mà
tổ chức, quốc gia có được. Những thông tin
này có thể là nội sinh/trong nước (do tổ chức
hoặc quốc gia đó tạo ra, lưu giữ, phổ biến),
thu thập được qua các kênh thông tin khác
nhau (mua, trao đổi, biếu tặng,....) hoặc truy
cập được một cách ổn định, lâu dài (thông
qua mua quyền truy cập hoặc có thể truy
cập được do bên có thông tin tạo điều kiện
truy cập lâu dài).
2.1. Khái niệm tài nguyên thông tin
KH&CN số
Thông tin KH&CN có thể được định
nghĩa là “thông tin/dữ liệu về tài liệu và dữ
kiện thu nhận được trong quá trình hoạt
động khoa học, khoa học kỹ thuật, đổi mới
sáng tạo và xã hội” [МОДЕЛЬНЫЙ ЗАКОН О
НАУЧНО-ТЕХНИЧЕСКОЙ ИНФОРМАЦИИ].
Nghị định 11/2014/NĐ-CP ngày18/02/2014
của Chính phủ về hoạt động thông tin
KH&CN xác định, thông tin KH&CN không
chỉ là thông tin/dữ liệu về tài liệu và dữ kiện,
mà còn là dữ liệu, dữ kiện, số liệu, tin tức
được tạo ra trong các hoạt động KH&CN,
đổi mới sáng tạo. Tri thức được coi là thông
tin khi nó được trình bày, được hiển thị trên
vật mang tin hoặc ở dạng đọc, xem được
(không phải là tri thức ẩn trong não của
người có tri thức (3).
Tài nguyên thông tin KH&CN có thể được
thể hiện dưới hai dạng tài nguyên thông tin
chính là: tài liệu KH&CN và dữ liệu nghiên
cứu. Tài liệu KH&CN gồm các loại như công
bố KH&CN được đăng tải trên các tạp chí
KH&CN (mà chúng ta thường gọi là bài báo
khoa học hay bài báo nghiên cứu), tài liệu
sáng chế, chuyên khảo, sách, các báo cáo
kết quả nhiệm vụ KH&CN, các bài trình bày
tại các hội nghị, hội thảo KH&CN, một số
loại hình tài liệu KH&CN khác,...). Công bố
KH&CN là dạng tài liệu KH&CN trình bày
những kết quả và tri thức thu nhận được từ
hoạt động nghiên cứu KH&CN hoặc được rút
ra, được nhận thức từ các hoạt động KH&CN
và các hoạt động khác, được đăng tải trên các
tạp chí KH&CN. Công bố KH&CN có thể bao
gồm những bài báo nghiên cứu, những thông
báo (communication) ngắn, những bài tổng
quan, tổng luận, được đăng trên các tạp chí
KH&CN. Dữ liệu nghiên cứu (research data)
có thể được định nghĩa là “những sự kiện,
Luật Thư viện 2019 định nghĩa: tài
nguyên thông tin là “tập hợp các loại hình
tài liệu, bao gồm: tài liệu in, bản chép tay,
tài liệu nghe nhìn, tài liệu vi dạng (vi phim,
vi phiếu), tài liệu số và tài liệu đặc biệt cho
người khuyết tật” [Luật Thư viện 2019]. Theo
Nghị định 11/2014/NĐ-CP của Chính phủ
về hoạt động thông tin KH&CN, tài nguyên
thông tin được hiểu “là các thông tin KH&CN
được thể hiện dưới dạng sách, báo, tạp chí
khoa học; kỷ yếu hội nghị, hội thảo khoa học;
thuyết minh nhiệm vụ, báo cáo kết quả thực
hiện, ứng dụng kết quả nhiệm vụ KH&CN;
tài liệu sở hữu trí tuệ, tiêu chuẩn, quy chuẩn con số, ký tự, và các ký hiệu mô tả một đối
kỹ thuật; catalô công nghiệp; luận án khoa tượng, ý tưởng, điều kiện, hoàn cảnh, hoặc
học; tài liệu thiết kế, kỹ thuật; CSDL; trang các yếu tố khác” hoặc “sự trình bày có thể
3.Trước đây, Nghị định 159/2004/NĐ-CP về hoạt động thông tin KH&CN định nghĩa thông tin KH&CN là “là
các dữ liệu, số liệu, dữ kiện, tin tức, tri thức KH&CN (bao gồm KH tự nhiên, KH công nghệ,KH xã hội và nhân
văn) được tạo lập, quản lý và sử dụng nhằm mục đích cung cấp dịch vụ công, phục vụ quản lý nhà nước hoặc đáp
ứng nhu cầu của tổ chức, cá nhân trong xã hội”.
4.Nghị định 14/2014/NĐ-CP sử dụng thuật ngữ “nguồn tin KH&CN”.
20 THÔNG TIN VÀ TƯ LIỆU - 1/2020
NGHIÊN CỨU-TRAO ĐỔI
diễn giải lại của thông tin theo cách thức hình thường được ghi và lưu giữ trên các vật mang
thức hóa phù hợp để truyền thông, giải thích, tin số như: ổ cứng máy tính (cố định hoặc lưu
hoặc xử lý [National Academy of Sciences,
2009]. Tổng cục Nghiên cứu và Đổi mới
sáng tạo của Uỷ ban châu Âu EC định nghĩa
dữ liệu nghiên cứu (Research data) là thông
tin, dữ kiện, số liệu được thu thập để nghiên
cứu và xem xét làm cơ sở cho suy luận, thảo
luận, tính toán [EC. Directorate - General for
Research & Innovation, 2016].
Tài nguyên thông tin KH&CN số (còn gọi
là tài nguyên điện tử) là những tài nguyên
ở dạng số/điện tử mà khi truy cập và khai
thác cần sự trợ giúp của các thiết bị công
động), đĩa quang, trên bộ nhớ của hệ thống
máy chủ, hoặc lưu giữ trên mạng intenet.
2.2. Hiện trạng tài nguyên thông tin khoa
học và công nghệ số ở Việt Nam
2.2.1. Sách KH&CN
Theo thống kê, trong những năm gần
đây, mỗi năm Việt Nam xuất bản khoảng
từ 28.000 đến 30.000 đầu tên sách với số
lượng bản in là khoảng hơn 310 triệu bản.
Trong đó có khoảng 1.200 đến 1.500 đầu
sách khoa học kỹ thuật, 7.500 đến 7.900
nghệ thông tin và truyền thông (máy tính, đầu sách khoa học xã hội (Bảng 1) [Cao
mạng thông tin, thiết bị di động/cầm tay...) và Minh Kiểm, 2019].
Bảng 1. Số lượng sách xuất bản tại Việt Nam giai đoạn 2015-2017
Năm
2016
Sách xuất bản
2015
2017
Số đầu tên sách xuất bản
Số bản sách xuất bản
(đơn vị: triệu bản)
29.014
30.069
28.717
362,8
334,3
313,9
Sách khoa học kỹ thuật
- Đầu tên sách
- Số bản (đơn vị: triệu bản)
Sách khoa học xã hội
- Đầu tên sách
1.532
7,6
1.599
4,1
1.293
3,3
7.593
24,8
7.950
15,0
7.878
20,4
- Số bản (đơn vị: triệu bản)
Truy cập ngày 17/8/2019)
Với công nghệ xuất bản hiện nay, có thể điểm cho các bài báo được công bố trong đó.
nói tất cả các sách KH&CN được xuất bản
đều qua khâu chế bản điện tử, như vậy đều
có bản số/điện tử của mỗi đầu sách. Tuy
nhiên, không có số liệu về việc lưu giữ hoặc
tạo lập, phát hành bản điện tử của các sách
KH&CN.
Tất cả các tạp chí KH&CN đều được chuẩn
bị bằng công nghệ chế bản điện tử, nghĩa là
có bản điện tử của các số tạp chí được xuất
bản. Tuy nhiên, số tạp chí KH&CN được
xuất bản ở dạng số không nhiều. Khảo sát
của tác giả Dương Thị Phương và cộng sự
[2019] ở Cục Thông tin KH&CN quốc gia
ở 155 tạp chí KH&CN cho thấy chỉ có một
(01) tạp chí xuất bản điện tử và 52 (chiếm
33%) tạp chí KH&CN có xuất bản ở cả hai
2.2.2. Tạp chí KH&CN
Ước tính, trong số trên 500 tên tạp chí
được xuất bản trong nước, có 334 tạp chí
khoa học được Hội đồng chức danh giáo sư
nhà nước đưa vào danh sách xem xét, tính dạng giấy và điện tử (Bảng 2).
THÔNG TIN VÀ TƯ LIỆU - 1/2020 21
NGHIÊN CỨU-TRAO ĐỔI
Bảng 2. Tổng hợp về dạng xuất bản của các tạp chí KH&CN
TC thuộc các trường TC thuộc Bộ/ngành, TC thuộc các hội,
Định
dạng
tài liệu
Tổng số
SL
ĐH, học viện viện NC&PT hiệp hội
SL
SL
%
SL
%
%
%
Chỉ ở
dạng
giấy
48
55
39
75
15
94
102 66
Chỉ ở
dạng
điện tử
1
1
0
0
0
0
1
1
Ở cả
hai định
dạng
38
44
13
25
1
6
52 33
Tổng
số
87
100
52
100
16
100
155 100
(Nguồn: Dương Thị Phương và cộng sự, 2019)
Một nguồn công bố KH&CN trên các tạp tắt kết quả thực hiện nhiệm vụ; bản điện tử
chí KH&CN định dạng số là hệ thống Tạp
chí khoa học Việt Nam trực tuyến (VJOL
- Vietnam Journals Online) do Cục Thông
tin KH&CN quốc gia duy trì. Theo thông tin
trên website này, hiện tại hệ thống có 98 tạp
chí KH&CN tham gia, cung cấp 46.245 bài
viết được cung cấp toàn văn dưới định dạng
PDF [VJOL, 2019].
phụ lục tổng hợp số liệu điều tra, khảo sát,
bản đồ, bản vẽ, ảnh, sách chuyên khảo,
bài tạp chí... tài liệu đa phương tiện, phần
mềm (nếu có). Bản điện tử phải sử dụng
định dạng Portable Document (.pdf) và phải
sử dụng phông chữ tiếng Việt - Unicode
(Time New Roman) theo tiêu chuẩn Việt
Nam (TCVN 6909:2001). Đây là nguồn tài
nguyên thông tin KH&CN dạng số rất có giá
trị. Cục Thông tin KH&CN quốc gia là cơ
quan nhà nước có thẩm quyền về đăng ký,
lưu giữ và phổ biến các kết quả nghiên cứu
khoa học và phát triển công nghệ. Tính đến
nay, Cục Thông tin KH&CN quốc gia đang
lưu giữ trên 27.800 báo cáo kết quả thực
hiện nhiệm vụ KH&CN các cấp. Ngoài Cục
Thông tin KH&CN quốc gia, các cơ quan
thông tin trực thuộc các bộ, ngành cũng lưu
giữ các kết quả thực hiện nhiệm vụ trong
phạm vi mình quản lý, các cơ quan thông tin
- thư viện thuộc trường đại học, cao đẳng,
cơ quan thông tin thuộc các viện nghiên cứu
cũng đều lưu giữ các báo cáo kết quả thực
hiện nhiệm vụ KH&CN có sử dụng ngân
2.2.3. Tài liệu xám
Nguồn tài nguyên thông tin KH&CN
không công bố (tài liệu xám - Grey literature)
có 2 loại hình quan trọng là: Báo cáo kết
quả thực hiện nhiệm vụ KH&CN và luận án
tiến sỹ.
- Báo cáo kết quả thực hiện nhiệm
vụ KH&CN: Theo quy định tại Thông tư
14/2014/TT-BKHCN ngày 11/6/2019, các
báo cáo kết quả thực hiện nhiệm vụ KH&CN
sử dụng ngân sách nhà nước phải được
thu thập, đăng ký và lưu giữ tại cơ quan có
thẩm quyền. Các cá nhân/tổ chức thực hiện
nhiệm vụ KH&CN phải nộp bản điện tử báo
cáo tổng hợp kết quả thực hiện nhiệm vụ
(file hoàn chỉnh, không tách riêng các file
chương, mục,…); bản điện tử Báo cáo tóm sách nhà nước.
22 THÔNG TIN VÀ TƯ LIỆU - 1/2020
NGHIÊN CỨU-TRAO ĐỔI
- Luận án tiến sỹ: Theo quy định, tất cả 12/2019, CSDL có hơn 34.650 biểu ghi,
các nghiên cứu sinh bảo vệ luận án tiến sỹ trong đó có hơn 29.230 biểu ghi về kết
trên lãnh thổ Việt Nam (người Việt Nam và quả thực hiện nhiệm vụ KH&CN (Báo cáo
tổng hợp), khoảng 4.300 biểu ghi nhiệm vụ
KH&CN đang tiến hành (5).
người nước ngoài) và nghiên cứu sinh người
Việt Nam bảo vệ luận án ở nước ngoài đều
phải nộp một bản luận án và tóm tắt luận án
tại Thư viện Quốc gia Việt Nam. Hiện nay,
Thư viện Quốc gia Việt Nam lưu giữ khoảng
29.200 bộ luận án tiến sĩ của người Việt
Nam bảo vệ trong nước và nước ngoài, và
của người nước ngoài bảo vệ tại Việt Nam,
với tổng số trang tài liệu hơn 4,5 triệu trang.
- CSDL luận án tiến sỹ ở Thư viện Quốc
gia Việt Nam. Đến tháng 12/2019, Thư viện
Quốc gia Việt Nam tạo lập được CSDL
luận án tiến sỹ với 20.477 luận án, tổng
số 314.239 trang [Thư viện Quốc gia Việt
Nam].
2.2.5. Dữ liệu nghiên cứu
2.2.4. Cơ sở dữ liệu
Dữ liệu nghiên cứu số là một nguồn tài
nguyên thông tin KH&CN số quan trọng.
Tuy nhiên, chưa có nghiên cứu đầy đủ về
nguồn tài nguyên dữ liệu nghiên cứu này.
Về cơ bản, dữ liệu nghiên cứu vẫn được
tự lưu giữ tại các cơ quan, đơn vị hoặc bộ
phận tạo ra chúng. Theo Nguyễn Thị Kim
Lân [2017], nói chung, các trung tâm TT-TV
và viện nghiên cứu chưa có hình thức dịch
vụ lưu trữ dữ liệu nghiên cứu.
Cơ sở dữ liệu (CSDL) KH&CN nội sinh
cũng là tài nguyên thông tin KH&CN số
quan trọng. Khảo sát năm 2011 của Phan
Huy Quế và cộng sự [2011] cho thấy, các
cơ quan thông tin - thư viện bộ, ngành địa
phương xây dựng hơn 140 CSDL nội sinh
các loại. Khảo sát gần đây của Cục Thông
tin KH&CN quốc gia cho thấy, các đơn vị
thuộc bộ, ngành đã xây dựng khoảng 2.620
CSDL; các trường đại học xây dựng khoảng
15.322 CSDL. Tuy nhiên, số lượng biểu ghi
là rất hạn chế. Một số CSDL KH&CN nội
sinh trong nước có quy mô tương đối lớn là:
Nghiên cứu về dữ liệu mở ở Việt Nam
cho thấy, dữ liệu ở Việt Nam còn hạn chế
[Trần Minh và cộng sự, 2017, 2018]. Hiện
tại, ở Việt Nam cũng đã có một số hệ thống
cung cấp dữ liệu mở như: Cổng dữ liệu mở
dựng theo Đề án phát triển Hệ tri thức Việt
số hóa. Tính đến hết tháng 10/2018 trên
cổng dữ liệu mở của itrithuc có 10.420 tập
dữ liệu [Trần Minh và cộng sự, 2018].
- CSDL công bố KH&CN Việt Nam (còn
gọi là CSDL tài liệu KH&CN Việt Nam) lưu
giữ thông tin về các bài báo KH&CN từ hơn
236 tạp chí KH&CN có tính điểm công trình.
Đến tháng 12/2019, CSDL có trên 264.500
biểu ghi thư mục, trong đó khoảng 70%
được đính kèm file toàn văn [Cục Thông tin
KH&CN quốc gia, 2019].
2.3. Một số hạn chế của tài nguyên thông
tin KH&CN số ở Việt Nam
- CSDL nhiệm vụ KH&CN là CSDL thư
mục lớn nhất Việt Nam về các nhiệm vụ
KH&CN, lưu giữ thông tin về kết quả thực
hiện nhiệm vụ (Báo cáo tổng hợp), nhiệm
vụ KH&CN đang tiến hành và kết quả
ứng dụng nhiệm vụ KH&CN. Đến tháng
Tìm hiểu hiện trạng tài nguyên thông
tin KH&CN của Việt Nam cho thấy việc
xây dựng và phát triển tài nguyên thông tin
KH&CN số còn nhiều hạn chế:
- Hầu hết CSDL được xây dựng và phát
moi-nhat.aspx?Type_CSDL=KETQUANHIEMVU
THÔNG TIN VÀ TƯ LIỆU - 1/2020 23
NGHIÊN CỨU-TRAO ĐỔI
triển như những CSDL độc lập, riêng lẻ, Thắng và Trần Thị Hải Yến 2016, 2017;].
không liên kết tạo thành hệ thống;
Sự quan tâm của Chính phủ và Bộ KH&CN
đến phát triển và chia sẻ tài nguyên thông
tin KH&CN được cụ thể hóa bằng việc
Thủ tướng chính phủ ban hành Quyết định
1258/QĐ-TTg ngày 01/10/2018 phê duyệt
đề án “Phát triển nguồn tin KH&CN phục
vụ NC&PT đến năm 2025 và định hướng
đến năm 2030” và Bộ KH&CN ban hành
kế hoạch triển khai thực hiện Đề án [Quyết
định số 3999/QĐ-BKHCN]. Trước xu thế
của Cách mạng công nghiệp 4.0 và chuyển
đổi số, hoạt động thông tin KH&CN cũng
cần triển khai thực hiện chuyển đổi số trong
phát triển tài nguyên thông tin KH&CN, tác
giả đề xuất một số nội dung chuyển đổi số
trong phát triển tài nghiên thông tin KH&CN.
- Hầu hết CSDL được xây dựng mới chỉ
là CSDL thư mục. Dữ liệu toàn văn của các
đối tượng thông tin (bài báo, báo cáo kết
quả nghiên cứu, luận án,...) nếu có mới chỉ
là ở dạng tệp đính kèm, chưa được đưa vào
quản lý, xử lý bên trong hệ thống CSDL.
Những CSDL như vậy mới chỉ hỗ trợ việc
tra cứu tìm kiếm thông tin (thư mục hoặc bài
toàn văn (nếu đính kèm). Trong kỷ nguyên
kỹ thuật số, những dữ liệu toàn văn nếu
được đưa vào quản lý, xử lý bên trong CSDL
có thể được xử lý tự động; hỗ trợ phân tích
thông tin dựa trên các công nghệ số như trí
tuệ nhân tạo, dữ liệu lớn,....
- Cấu trúc dữ liệu của các CSDL khác
nhau; không có chuẩn cấu trúc dữ liệu được
chấp nhận chung (trừ trường hợp các CSDL
về sách tuân thủ theo khổ mẫu MARC 21);
điều này hạn chế sự liên thông, chia sẻ, kết
nối dữ liệu của các CSDL;
3.1. Triển khai thực hiện chuyển đổi số
trong xây dựng và phát triển CSDL quốc
gia về KH&CN
Tài nguyên thông tin KH&CN số là
hạ tầng dữ liệu cốt lõi của hạ tầng thông
tin KH&CN, trong đó CSDL quốc gia về
KH&CN có vai trò quan trọng. CSDL quốc
gia được định nghĩa là tập hợp thông tin của
một hoặc một số lĩnh vực kinh tế - xã hội
được xây dựng, cập nhật và duy trì đáp ứng
yêu cầu truy nhập và sử dụng thông tin của
các ngành kinh tế và phục vụ lợi ích công
cộng [Luật Công nghệ thông tin 2006]. Tiêu
chí xác định CSDL quốc gia gồm [Nguyễn
Trọng Khánh, 2016]:
- Có sự trùng lặp giữa các CSDL tương
tự của các tổ chức (như CSDL về nhiệm vụ
KH&CN có thể được nhiều bộ, ngành hoặc
địa phương (Sở KH&CN) cùng thực hiện;
- Chưa có nhiều quy định về chuẩn xử
lý dữ liệu (như các bộ từ điển từ chuẩn; các
bảng phân loại; các mã định danh được
thống nhất).
3. MỘT SỐ Ý KIẾN VỀ CHUYỂN ĐỔI SỐ TRONG
PHÁT TRIỂN TÀI NGUYÊN THÔNG TIN KHOA
HỌC VÀ CÔNG NGHỆ SỐ Ở VIỆT NAM
- Lưu trữ thông tin quốc gia, có quy mô
lớn, tầm quan trọng ảnh hưởng đến chính
trị, sự phát triển kinh tế, xã hội của đất nước;
Phát triển và chia sẻ tài nguyên thông
tin KH&CN, nhất là nguồn tài nguyên thông
tin số, phục vụ hoạt động thông tin KH&CN
trong nước đã được nhiều tác giả đề cập
[Nguyễn Hữu Hùng, 2005; Nguyễn Tiến
Đức, 2006; Phạm Văn Hùng, 2015; Cao
Minh Kiểm và Nguyễn Tuấn Hải, 2013;
Cao Minh Kiểm và cộng sự, 2015; Cao
- Dữ liệu được dùng chung, chia sẻ giữa
các bộ, ngành, địa phương;
- Có phạm vi, đối tượng, thuộc tính dữ
liệu phủ rộng toàn quốc;
- Làm hạ tầng thông tin, tạo nền tảng
cho các hệ thống thông tin khác hoạt động
Minh Kiểm và Lê Thị Hoa, 2017; Đào Mạnh và phát triển.
24 THÔNG TIN VÀ TƯ LIỆU - 1/2020
NGHIÊN CỨU-TRAO ĐỔI
CSDL quốc gia về KH&CN được hiểu
là tập hợp thông tin về tiềm lực và kết quả
hoạt động KH&CN quốc gia được xây dựng,
duy trì và phát triển nhằm cung cấp dữ liệu
và thông tin đầy đủ, chính xác, kịp thời về
KH&CN, phục vụ hoạch định chính sách,
lãnh đạo, quản lý, nghiên cứu khoa học
và phát triển công nghệ, giáo dục và đào
tạo, sản xuất, kinh doanh [Cao Minh Kiểm
2015]. Nghị định 11/2014/NĐ-CP của Chính
phủ về thông tin KH&CN đã quy định CSDL
quốc gia về KH&CN là một bộ phận của hạ
tầng thông tin KH&CN và bao gồm những
CSDL thành phần chính: CSDL về tổ chức
KH&CN; CSDL về cán bộ NC&PT; CSDL
về nhiệm vụ KH&CN (đang tiến hành, đã
kết thúc và kết quả ứng dụng); CSDL về tài
liệu sở hữu trí tuệ, các công bố KH&CN và
chỉ số trích dẫn; CSDL về công nghệ, công
nghệ cao, chuyển giao công nghệ; CSDL
về thông tin, thống kê KH&CN; CSDL về
doanh nghiệp KH&CN; CSDL thông tin về
KH&CN trong khu vực và trên thế giới; Các
thông tin khác có liên quan).
Hình 2. Quan hệ giữa các CSDL: Nhiệm
vụ KH&CN, Công bố KH&CN; Tổ chức
KH&CN và Cán bộ KH&CN
CSDL nhiệm vụ KH&CN Việt Nam là
CSDL thư mục lớn nhất Việt Nam về các
nhiệm vụ KH&CN nghệ, bao gồm: CSDL
nhiệm vụ KH&CN nghệ đang tiến hành,
CSDL kết quả thực hiện nhiệm vụ KH&CN
và CSDL ứng dụng kết quả thực hiện nhiệm
vụ KH&CN. CSDL Nhiệm vụ KH&CN hiện
đã được xây dựng, duy trì và quản lý tập
trung tại Cục Thông tin KH&CN quốc gia.
Những tìm hiểu về hiện trạng hạ tầng
thông tin, thống kê KH&CN cho thấy, hiện
tại chúng ta đã có những cơ sở ban đầu cho
hệ thống CSDL quốc gia về KH&CN, tuy
vậy, những CSDL thành phần của CSDL
quốc gia về KH&CN còn phân tán, không
được quản lý tập trung. Đề án “Phát triển
nguồn tin KH&CN phục vụ NC&PT đến
năm 2025 và định hướng đến năm 2030” đã
yêu cầu tăng cường xây dựng và hoàn thiện
CSDL nhiệm vụ KH&CN và CSDL công
bố KH&CN. Hai CSDL (CSDL nhiệm vụ
KH&CN và CSDL công bố KH&CN), cùng
với CSDL tổ chức KH&CN và CSDL cán
bộ NC&PT là những CSDL quan trọng của
CSDL quốc gia về KH&CN được đề xuất
xây dựng, phát triển và duy trì tập trung tại
Cục Thông tin KH&CN. Đây là những CSDL
thành phần có mối liên quan chặt chẽ với
CSDL Công bố KH&CN Việt Nam đã
được Cục Thông tin KH&CN quốc gia xây
dựng từ năm 1987 và hiện là CSDL lớn nhất
của Việt Nam về công bố KH&CN đăng tải
trên các tạp chí KH&CN trong nước, trong
đó có nhiều tạp chí KH&CN được tính điểm
công trình. Chúng ta có thể sử dụng kinh
phí để mua các CSDL thư mục của quốc tế
nhưng không thể mua được CSDL về công
bố KH&CN của các nhà nghiên cứu của
Việt Nam đăng tải trên các tạp chí KH&CN
của Việt Nam.
Dữ liệu cơ bản về tổ chức KH&CN đã
có (thông qua các cuộc điều tra thống kê
NC&PT, điều tra tiềm lực KH&CN của tổ
chức KH&CN do Cục Thông tin KH&CN
quốc gia thực hiện, tuy nhiên những dữ liệu
nhau, trong đó CSDL nhiệm vụ KH&CN có này vẫn chưa được tích hợp để tạo thành
vị trí quan trọng (Hình 2).
CSDL hoàn chỉnh về tổ chức KH&CN.
THÔNG TIN VÀ TƯ LIỆU - 1/2020 25
NGHIÊN CỨU-TRAO ĐỔI
Hiện nay, những CSDL này tuy được trang-chu.aspx], và dường như chúng vẫn
đưa chung vào Hệ thống thông tin KH&CN là các CSDL riêng rẽ, không có sự liên
do Cục Thông tin KH&CN quốc gia thông, liên kết hữu cơ như một CSDL quốc
Hình 3. Trang chủ Hệ thống thông tin KH&CN
do Cục Thông tin KH&CN quốc giáxây dựng
Vì thế, thực tế chúng ta vẫn chưa có thu nhập dữ liệu khác nhau, không thống
CSDL quốc gia về KH&CN đúng nghĩa. Để nhất; không có một từ điển dữ liệu đặc tả
thực hiện chuyển đổi số trong xây dựng và (metadata) dùng chung cho toàn hệ thống.
phát triển CSDL quốc gia về KH&CN cần Những công nghệ được sử dụng để xây
thiết:
dựng CSDL thành phần hiện nay chỉ có
thể đáp ứng được những yêu cầu đơn giản
(tra cứu, tìm kiếm,...) mà chưa có khả năng
phân tích dữ liệu; có có khả năng thu thập
dữ liệu lớn không có cấu trúc (big data). Do
đó, việc xây dựng được mô hình CSDL về
KH&CN phù hợp sẽ đảm bảo cho phát triển
hệ thống phần mềm phù hợp;
- Hoàn thiện mô hình kiến trúc CSDL
quốc gia về KH&CN. Theo Thông tư
14/2014/TT-BKHCN, CSDL quốc gia về
KH&CN bao gồm 10 CSDL thành phần,
trong đó có 7 CSDL được xây dựng và quản
lý tập trung tại Cục Thông tin KH&CN quốc
gia và 3 CSDL thành phần khác được xây
dựng và quản lý ở tổ chức ngoài Cục Thông
- Xây dựng và hoàn thiện kiến trúc dữ
tin KH&CN quốc gia (CSDL thông tin sở liệu, các quy chuẩn, tiêu chuẩn, phương án
hữu trí tuệ; CSDL thông tin Tiêu chuẩn - đo kỹ thuật của CSDL quốc gia về KH&CN để
lường - Chất lượng và CSDL doanh nghiệp đảm bảo sự duy trì và phát triển bền vững,
KH&CN). Tuy nhiên, những CSDL này được sự minh bạch về cấu trúc thông tin và khả
xây dựng độc lập, trên các nền tảng khác năng cung cấp, chia sẻ thông tin từ CSDL
nhau; áp dụng các quy trình và phương tiện quốc gia về KH&CN. Trước mắt, cần xây
26 THÔNG TIN VÀ TƯ LIỆU - 1/2020
NGHIÊN CỨU-TRAO ĐỔI
dựng được kiến trúc dữ liệu (từ điển dữ liệu 3.2. Phát triển truy cập mở đến tài nguyên
thông tin KH&CN số
đặc tả) cho một số CSDL có liên quan chặt
chẽ và do Cục Thông tin KH&CN quốc gia
quản lý (CSDL nhiệm vụ KH&CN; CSDL
cán bộ NC&PT, CSDL Tổ chức KH&CN;
CSLD công bố KH&CN). Kiến trúc dữ liệu
chuẩn sẽ đảm bảo việc thể hiện nội dung,
cấu trúc và thuộc tính dữ liệu trong CSDL
quốc gia. Việc thống nhất kiến trúc dữ liệu
đảm bảo thông tin phải hiểu đúng và thống
nhất giữa các bên liên quan khi cập nhật và
khai thác CSDL;
Truy cập mở đến kết quả nghiên cứu và
phát triển đang là một xu thế và được coi
là một phương thức phát triển tài nguyên
KH&CN. Ở Việt Nam, vấn đề truy cập mở tài
nguyên thông tin thư mục cũng đã bước đầu
được đề cập, tuy nhiên mới chủ yếu trong
lĩnh vực đào tạo và tài liệu học tập [Đỗ Văn
Hùng 2016, 2017]. Cục Thông thông tin
KH&CN Quốc gia đã cho truy cập miễn phí
đến thông tin toàn văn của CSDL Công bố
KH&CN nhưng mới chỉ áp dụng cho thành
viên của Liên hợp thư viện Việt Nam và các
thành viên Mạng Nghiên cứu và Đào tạo
Việt Nam (VinaREN). Một số lượng tương
đối tạp chí KH&CN trong nước có thể được
truy cập mở trên hệ thống Tạp chí khoa học
Việt Nam trực tuyến VJOL (Vietnam Journal
On-line) [Lê Thị Hoa, 2013]. Đại học quốc
gia Hà Nội đã xây dựng kho tài liệu số nội
viên, sinh viên, học viên có thể đọc miễn
phí các đầu sách, tài liệu học thuật chất
lượng, đa ngành, đa lĩnh vực trong kho tài
liệu số này. Thư viện học liệu mở Việt Nam
trình giáo dục mở Việt Nam (Vietnam Open
Educational Resources - VOER) phát triển
là một kho tài nguyên giáo dục mở cho
người Việt sử dụng và truy nhập miễn phí
nguồn tài liệu hữu ích phục vụ giảng dạy,
học tập và nghiên cứu, cũng như phục vụ
cho toàn xã hội.
- Xây dựng các quy định về mô tả dữ
liệu, trình diễn dữ liệu và các quy định khác
đảm bảo dữ liệu thống nhất và rõ ràng, đơn
nghĩa;
- Xây dựng các chuẩn cho công tác xử
lý nội dung trong xây dựng CSDL (các bảng
phân loại, các công cụ phục vụ định chỉ
mục; các quy tắc mô tả);
- Xây dựng được những hệ thống mã
định danh cho các đối tượng thông tin để
đảm bảo sự liên kết, kết nối giữa các CSDL
(ví dụ định danh cho tổ chức KH&CN; định
danh cán bộ nghiên cứu; định danh cho khu
vực địa lý (tỉnh/thành phố); định danh cho
bài báo,..
- Ứng dụng các phần mềm hiện đại,
phục vụ cho thiết kế và xây dựng hệ thống
phần mềm CSDL tiên tiến, tính năng cao,
tương thích với các chuẩn CSDL quốc tế;
Chúng ta có thể tham khảo và học tập
mô hình dữ liệu của Hệ thống Thông tin
nghiên cứu châu Âu euroCRIS (European
Current Research Information System)
[euroCRIS]) để nghiên cứu và xây dựng
mô hình kiến trúc dữ liệu cho CSDL quốc
gia về KH&CN. euroCRIS đã xây dựng Khổ
mẫu Thông tin nghiên cứu chung CERIF
(Common European Research Information
Format) và khuyến nghị áp dụng cho các hệ
thống thông tin nghiên cứu, hỗ trợ chia sẻ
Truy cập mở đến dữ liệu nghiên cứu liên
quan đến vấn đề dữ liệu mở (Open data).
Rào cản đối với phát triển truy cập đến dữ
liệu nghiên cứu có thể là vấn đề pháp lý, từ
chối quản lý và giám sát dữ liệu; quy định
về sự riêng tư không cho phép công khai
thông tin; sự lo ngại về chất lượng dữ liệu;
thiếu sự chuẩn hóa; thiếu chính sách dữ
liệu mở; thiếu năng lực công khai dữ liệu
và đảm bảo tính liên thông kết nối giữa các hoặc tổn thất về doanh thu hay tính bảo mật
hệ thống thông tin nghiên cứu [CERIF]. [Trần Minh, 2017].
THÔNG TIN VÀ TƯ LIỆU - 1/2020 27
NGHIÊN CỨU-TRAO ĐỔI
Phát triển và chia sẻ tài nguyên thông 3.3. Triển khai ứng dụng mã định danh số
tin KH&CN thông qua truy cập mở cần được cho tài nguyên thông tin KH&CN số
thúc đẩy. Để tăng cường công tác truy cập
Trong môi trường số, việc duy trì đảm
mở chúng ta cần:
bảo truy cập đến tài nguyên số là rất
- Nâng cao nhận thức của các ngành,
các cấp, các tổ chức KH&CN về truy cập
mở, vai trò và lợi ích của truy cập mở;
- Hoàn thiện khung pháp lý để đảm bảo
thực hiện truy cập mở đến kết quả nghiên
cứu sử dụng kinh phí từ ngân sách nhà
nước; xây dựng và thực hiện chính sách
về truy cập mở đến kết quả KH&CN từ các
nghiên cứu sử dụng ngân sách nhà nước;
quan trọng. Định danh duy nhất bền vững
(Persistent Unique Identifier - PUID) cung
cấp một phương thức định danh ổn định
lâu dài cho các đối tượng số. Mã định danh
bền vững (persistent identifier, PI or PID)
được hiểu là một tham chiếu tồn tại lâu dài
đến một tài liệu, tệp tin, trang web hoặc đối
tượng khác [Wiki]. Một định danh bền vững
được đảm bảo để quản lý và duy trì không
Các cơ quan cấp kinh phí cho hoạt động thay đổi trong một thời gian dài [Australian
KH&CN nghiên cứu ban hành các quy định National Data Services]. Những mã định
về truy cập mở;
danh này được toàn cầu hóa, tiêu chuẩn hóa
và được sử dụng rộng rãi trong môi trường
kỹ thuật số và có thể cung cấp thông tin về
đối tượng, bất kể đối tượng nằm ở đâu. Việc
sử dụng định danh duy nhất bền vững giúp
cho người dùng tin chắc chắn rằng mình sẽ
lấy được đúng tài nguyên (công trình) mình
cần ngay cả khi vị trí thực trên Web của nó
đã thay đổi nhờ việc ánh xạ tới một bộ định
vị hoặc bộ định vị cập nhật, tạo điều kiện
cho việc truy cập vào (các) biểu hiện vật lý
của tài nguyên. Hiện nay, tồn tại nhiều loại
định danh cho đối tượng số như: Định danh
số cho đối tượng (DOI), định danh Khóa Tài
nguyên lưu trữ ARK (Archieval Resources
Key identifier) [ARK], Handles [Sun S. ,
Lannom L., Boesch B., 2003], mã định danh
Nhà nghiên cứu và Cộng sự mở ORCiD
[Open Researcher and Contributor ID],...
- Đảm bảo việc truy cập mở đến tất cả
các tạp chí KH&CN do nhà nước cấp kinh
phí; Tiếp tục hỗ trợ duy trì và phát triển hệ
thống Tạp chí khoa học Việt Nam trực tuyến
(VJOL); Nghiên cứu xây dựng kho lưu trữ
(repository) về các công bố KH&CN của
Việt Nam do các tác giả Việt Nam công bố
trên các tạp chí KH&CN quốc tế;
- Tăng cường xây dựng các kho lưu trữ số
nội bộ truy cập mở tại các tổ chức KH&CN.
Các tổ chức KH&CN (các viện nghiên
cứu, trường đại học) cần xây dựng những
hệ thống lưu trữ số nội bộ (Institutional
repositories) là cơ sở hạ tầng kỹ thuật cần
thiết cho lưu chiểu và cung cấp truy cập mở
đến các kết quả của nghiên cứu sử dụng
kinh phí từ ngân sách nhà nước.
- Đẩy mạnh truy cập mở đến dữ liệu
nghiên cứu, cần nghiên cứu và ban hành
những quy định pháp lý để triển khai thực
hiện dữ liệu mở, như: xác định rõ phạm vi
dữ liệu mở; quy định về phân loại dữ liệu;
tiêu chuẩn dữ liệu mở: như quy tắc đặt tên
(các tệp dữ liệu nên chứa thông tin về nhà
cung cấp, thời gian cung cấp, tên tệp, kiểu
dữ liệu), khuôn dạng dữ liệu (các tập dữ
liệu mở phải sẵn có ở dạng máy có thể đọc
được, khuyến nghị dưới dạng định dạng mở
như: CSV, JSON, XML, etc..); mô tả (tạo lập
siêu dữ liệu);,...
Đối với tài nguyên số thông tin KH&CN,
mã định danh DOI được sử dụng rất rộng
rãi trên toàn cầu [Dương Thị Phương và
cộng sự, 2019]. DOI được sử dụng cho tài
liệu số và dữ liệu số. Hiện nay ở Việt Nam,
đã có một số tổ chức áp dụng DOI cho tạp
chí KH&CN do mình xuất bản. Khảo sát
của Dương Thị Phương và cộng sự [2019]
cho thấy trong số 155 tạp chí được hỏi, có
42 tạp chí (chiếm tỷ lệ 27%) đã ứng dụng
DOI và 113 tạp chí (chiếm 73%) chưa ứng
dụng DOI (Hình 14). Theo khảo sát, tất cả
28 THÔNG TIN VÀ TƯ LIỆU - 1/2020
NGHIÊN CỨU-TRAO ĐỔI
42 tạp chí đã ứng dụng DOI đều áp dụng lý mã định danh DOI cho tài nguyên thông
phương thức đăng ký trực tiếp DOI thông
qua tổ chức CrossRef. Việc triển khai áp
dụng DOI cho tài liệu số KH&CN và dữ
liệu nghiên cứu là cần thiết. Đề xuất của
nhóm nghiên cứu của Dương Thị Phương
tin KH&CN ở Việt Nam, trong đó hình thành
Trung tâm DOI Việt Nam tại Cục Thông
tin KH&CN quốc gia là rất đáng quan tâm
[Hình 4]. Chúng ta cần nhanh chóng nghiên
và cộng sự [2019] về mô hình cấp và quản cứu triển khai vào thực tế mô hình này.
IDF
Vietnam DOI
Japan Link
v.v.
Crossref
Center
Center
v.v.
v.v.
Hình 4. Mô hình cấp và quản lý DOI quy mô quốc gia tại Việt Nam
(Nguồn:Dương Thị Phương và cộng sự, 2019)
KH&CN là cần tập trung xây dựng CSDL
quốc gia về KH&CN. Cần nghiên cứu xây
dựng và hoàn thiện mô hình kiến trúc CSDL
quốc gia về KH&CN; xây dựng và ban hành
kiến trúc dữ liệu chung cho hệ thống CSDL
quốc gia về KH&CN, các quy định pháp lý,
kỹ thuật, công nghệ cho CSDL quốc gia về
KH&CN.
4. KẾT LUẬN
Trong bối cảnh của cuộc Cách mạng
công nghiệp 4.0, chuyển đổi số đang diễn
ra nhanh chóng ở các nước phát triển trên
thế giới. Ở Việt Nam, vấn đề chuyển đổi số
đã trở thành yêu cầu cấp bách đối với mọi
lĩnh vực kinh tế - xã hội. Tầm quan trọng
của chuyển đổi số đã được thể hiện ở việc
Chính phủ giao nhiệm vụ cho Bộ Thông tin
và Truyền thông xây dựng Đề án chuyển
đổi số quốc gia.
Để đảm bảo hạ tầng dữ liệu cho chuyển
đổi số, cần tiếp tục quan tâm phát triển
nguồn tài nguyên số KH&CN, triển khai thực
hiện truy cập mở đến tài nguyên thông tin
KH&CN. Phát triển dữ liệu mở cần được chú
trọng trong thời gian tới. Đồng thời chúng ta
cần nghiên cứu áp dụng mã định danh số
cho đối tượng (DOI), hoàn thiện mô hình cấp
và quản lý DOI ở quy mô quốc gia.
Lĩnh vực TT-TV KH&CN liên quan chặt
chẽ đến tài nguyên thông tin KH&CN, trong
đó có tài nguyên thông tin KH&CN số cũng
cần nghiên cứu triển khai thực hiện chuyển
đổi số. Mặc dù thời gian vừa qua chúng ta đã
xây dựng được nguồn tài nguyên thông tin
KH&CN số có giá trị phục vụ cho phát triển
kinh tế xã hội, tuy nhiên nguồn tài nguyên số
này còn nhiều hạn chế cần được chú trọng
phát triển trong bối cảnh chuyển đổi số.
TÀI LIỆU THAM KHẢO
1. ARK - Archival Resource Key Identifiers.
2. Australian National Data Services. Persistent
org.au/guides/persistent-identifiers-awareness
Một trong những nội dung thực hiện
chuyển đổi số trong hoạt động thông tin
THÔNG TIN VÀ TƯ LIỆU - 1/2020 29
NGHIÊN CỨU-TRAO ĐỔI
3. Bộ TT&TT (2019). Đề án Chuyển đổi số quốc
gia: Dự thảo 1.0, ngày 04/4/2019. Tải xuống ngày
PL03-DU-THAO-DE-AN-CHUYEN-DOI-SO-
QG-VER-1.0.pdf
dụng “Mã định danh tài liệu số (Digital Object
Identifier - DOI) đối với tài nguyên số của Việt
Nam”. Báo cáo đề tài nghiên cứu cấp bộ. H: Cục
Thông tin KH&CN quốc gia, 2019 (Bản bảo
vệ cấp cơ sở).
14. EC. Directorate-General for Research
&Innovation, 2016. Guidelines on Open Access
to Scientific Publications and Research Data in
participants/data/ref/h2020/grants_manual/h i/
4. Cao Minh Kiểm (2015). Một số nội dung chủ
yếu cho hiện đại hóa hạ tầng thông tin, thống kê
KH&CN Việt Nam. TC Thông tin - Tư liệu,
số 2/2015, tr. 11-17.
5. Cao Minh Kiểm (2017). Chính sách truy cập
mở đến kết quả nghiên cứu sử dụng kinh phí
công trên thế giới và đề xuất với Việt Nam. Hội
thảo “Phát triển và chia sẻ nguồn tài liệu số
nhằm hỗ trợ hoạt động của Quốc hội vì sự phát
triển bền vững tại Việt Nam”, 14/4/2017, Hà Nội,
Việt Nam.
oa_pilot/h2020-hi-oa-pilot-guide_en.pdf.
cập 23/11/2016
Truy
15. euroCRIS. https://www.eurocris.org/what eurocris
16.GartnerGlossary.https://www.gartner.com/en/
information-technology/glossary/digitalization
17. Gartner IT Glossary. https://www.gartner.
6. Cao Minh Kiểm (2018). Truy cập mở đến kết
quả nghiên cứu sử dụng kinh phí công - tìm hiểu
kinh nghiệm trên thế giới và đề xuất đối với Việt
Nam. Hội thảo “Số hóa tri thức KH& CN
đáp ứng yêu cầu của Cách mạng công nghiệp
4.0”, ngày 19/12/2018, Hà Nội, Việt Nam.
com/it-glossary/digital- transformation
18. Hồ Tú Bảo (2018). Thời chuyển đổi số, trí tuệ
ac.jp/~bao/VNAlectures/DSlop1HoBao(M3).pdf
19. IFLA(2002). Guidelines for digitization projects
for collections and holdings in the public domain,
particularly those held by libraries and archives.
March 2002.
7. Cao Minh Kiểm và Nguyễn Tuấn Hải (2013).
Chia sẻ tài nguyên thông tin trên mạng Nghiên
cứu và đào tạo Việt Nam (VinaREN). TC Thông
tin và Tư liệu: Phụ trương chuyên đề, 2013.
Tr.46 52
20. Igniger Anna (2017). Difference between
Digitization,
Digitalization
and
Digital
Transformation.
net/blog/difference-
digitalization-and-digital-transformation#
between-digitization-
features-cerif
9. Cục Thông tin KH&CN quốc gia. CSDL
danh-sach-tai-lieu-khcn-moi-nhat.aspx?Type_
CSDL=TAILIEUKHCN
scoop.eu/digital- transformation/
22. Luật Công nghệ Thông tin - Luật số 67/2006/
vn/van-ban/Cong-nghe-thong-tin/Luat-cong-
nghe-thong-tin-2006-67-2006-QH11-12987.
aspx
10. Cục Tin học hóa, Bộ Thông tin và Truyền
thông (2018). Tổng quan chuyển đổi số tại Việt
Nam. Bài trình bày tại Hội thảo “Chuyển đổi số:
cơ hội và thách thức”, do Hội Truyền thông số
Việt Nam tổ chức tại Hà Nội, ngày 19/11/2019.
23. Luật Thư viện 2019 - Luật số 46/2019/QH14.
hanh-chinh/Luat-Thu-vien-2019-398157.aspx
11. Đào Mạnh Thắng và Trần Thị Hải Yến (2016).
Định hướng quốc gia về phát triển nguồn tin
khoa học và công nghệ. TC Thông tin và Tư liệu,
số 5/2016. Tr.3-12.
24.NationalAcademyofSciences(US),National
Academy of Engineering (US) and Institute
of Medicine (US) Committee on Ensuring
the Utility and Integrity of Research Data in
a Digital Age (2009). Ensuring the Integrity,
Accessibility, and Stewardship of Research
Data in the Digital Age. Washington (DC):
National Academies Press (US); 2009. https://
12. Đào Mạnh Thắng và Trần Thị Hải Yến
(2017). Phát triển nguồn tin khoa học và công
nghệ trong thời đại công nghệ số. TC Thư viện
Việt Nam, số 1/2017. Tr.12-21
13. Dương Thị Phương và cộng sự (2019).
Nghiên cứu cơ sở lý luận và thực tiễn để ứng
30 THÔNG TIN VÀ TƯ LIỆU - 1/2020
NGHIÊN CỨU-TRAO ĐỔI
Bookshelf_ NBK215264.pdf. Truy cập ngày 34. Sun S. , Lannom L., Boesch B., 2003.
23/11/2016
org/rfc/rfc3650.txt
25. Nguyễn Hữu Hùng (2005). Vấn đề phát triển
và chia sẻ nguồn tin số hóa tại Việt Nam. Thông
tin KH&CN Quảng Bình, số 4, 2005.Tr.46-
49,51
35. The DOI system. https://www.doi.org/
36. Thông tư 14/2014/TT-BKHCN ngày 11/6/2014
Quy định về thu thập, đăng ký, lưu giữ và công
bố thông tin về nhiệm vụ KH&CN. https://
thuvienphapluat.vn/van-ban/Cong-nghe-thong-
tin/Thong-tu-14-2014-TT-BKHCN-thu-thap-
dang-ky-luu-giu-cong-bo-thong-tin-nhiem- vu-
khoa-hoc-cong-nghe-238285.aspx
26. Nguyễn Thị Kim Lân (2017). Quản lý dữ liệu
nghiên cứu: Một cách tiếp cận quản trị dữ liệu
cho các thư viện Việt Nam. Tạp chí Thư viện
Việt Nam. - 2017. - Số 3. - Tr. 19-24,42. http://
nlv.gov.vn/nghiep-vu-thu-vien/quan-ly-du-lieu-
nghien-cuu-mot-cach-tiep-can-quan-tri-du-lieu-
cho-cac-thu-vien-viet-nam.html
37. Thư viện quốc gia Việt Nam. CSDL toàn văn
tháng 12/2019.
27. Nguyễn Tiến Đức. Bàn về tạo lập và chia sẻ
nguồn tin số hóa đối với các cơ quan thông tin
KH&CN địa phương. TC Thông tin và Tư
liệu. số 1/2006. Tr.11-17.
38. Trần Minh, 2017. Báo cáo tổng quan về dữ liệu
mở. Viện Công nghiệp phần mềm và nội dung
file=806
28. Nguyễn Trọng Khánh (2016). Cơ sở dữ liệu
quốc gia: Nền tảng phát triển Chính phủ điện tử.
Bài trình bày tại Hội thảo Xây dựng và phát triển
CSDL quốc gia về KH&CN, đổi mới sáng
tạo. Do Cục Thông tin KH&CN quốc gia tổ
chức ngày 6 tháng 10 năm 2016, tại Hà Nội.
39. Trần Minh, Đỗ CôngAnh, Tô Thị Thiên Ngân,
Lương Thị Thu Hà, Chu Thị Thắm, Nguyễn
Thị Yến và Đỗ Hoàng Anh Tuấn (2018). Nghiên
cứu cơ sở khoa học và thực tiễn để định hướng
chính sách khuyến khích và thúc đẩy dữ liệu mở
Việt Nam. Báo cáo đề tài cấp bộ, 2018. 204 tr.
29. Open Researcher and Contributor ID.
30. Phạm Văn Hùng (2015). Phát triển nguồn tin
KH&CN trong giai đoạn mới: Thách thức,
cơ hội và giải pháp. TC Thông tin và Tư liệu, số
6/2015, tr.31-37.
40. VJOL (2019). http://www.vjol.info/index.php/
index/index. truy cập 12/2019.
31. Phan Huy Quế, et al. (2011). Báo cáo tổng
quan về kết quả khảo sát một số nội dung hoạt
động của cơ quan thông tin thư viện. Đề tài
“Nghiên cứu cơ sở lý luận và thực tiễn phát triển
công tác thông tin, thư viện và thống kê KH&CN
Việt Nam đến năm 2020”, Chủ nhiệm đề tài: ThS
Phan Huy Quế.
41.
Wiki.
Persistent
Identifier.
https://
en.wikipedia.org/wiki/Persistent_identifier
42. Wikipedia. Digital transformation. https://
en.wikipedia.org/wiki/Digital_transformation
Truy cập 22/7/2019.
.
43. МОДЕЛЬНЫЙ ЗАКОН О НАУЧНО-
ТЕХНИЧЕСКОЙ ИНФОРМАЦИИ. Принят
на пятнадцатом пленарном заседании
Межпарламентской Ассамблеи государств -
участников СНГ (постановление № 15-10 от
июня 2000 года). “сведения о документах и
фактах, получаемых в ходе научной, научно-
технической, инновационной и общественной
деятельности”
32. Quyết định số 1285/QĐ-TTg ngày 01/10/2018
của Thủ tướng Chính phủ phê duyệt Phát triển
nguồn tin KH&CN phục vụ NC&PT đến năm
2025 và định hướng đến năm 2030 https://
luatvietnam.vn/khoa-hoc/quyet-dinh-1285-qd-
ttg-2018-de-an-phat-trien-nguon-tin-khoa-hoc-
va-cong- nghe-167560-d1.html
33. Quyết định số 3999/QĐ-BKHCN ban hành Kế
hoạch của Bộ KH&CN triển khai Quyết định
số 1285/QĐ-TTg của Thủ tướng Chính phủ phê
duyệt Đề án “Phát triển nguồn tin KH&CN
phục vụ nghiên cứu khoa học và phát triển công
nghệ đến năm 2025, định hướng 2030”.
(Ngày Tòa soạn nhận được bài: 10-11-2019;
Ngày phản biện đánh giá: 4-12-2019; Ngày
chấp nhận đăng: 15-01-2020).
THÔNG TIN VÀ TƯ LIỆU - 1/2020 31
Bạn đang xem tài liệu "Chuyển đổi số trong phát triển tài nguyên thông tin khoa học và công nghệ số", để tải tài liệu gốc về máy hãy click vào nút Download ở trên
File đính kèm:
- chuyen_doi_so_trong_phat_trien_tai_nguyen_thong_tin_khoa_hoc.pdf