Dane syntetyczne

Jeżeli badanie naukowe, publikacja, rozprawa lub praca dyplomowa wykorzystuje lub bazuje na danych syntetycznych, to kluczowe jest, by w treści dokumentu wprost zaznaczyć, że użyte dane mają charakter syntetyczny.

Do takich danych powinny być dołączone odpowiednie metadane, które jasno potwierdzają ich syntetyczne pochodzenie oraz opisują proces ich generowania.

Przykład:
Jeżeli dane zapisane są w arkuszu kalkulacyjnym (np. w formacie CSV lub Excel), do pliku z danymi należy dołączyć plik README.txt zawierający informację:

Niniejszy zbiór danych został automatycznie wygenerowany z użyciem generatywnej sztucznej inteligencji, przy wykorzystaniu:

promptu, np.: „Wygeneruj dane o następujących cechach…”,

przykładowych wartości, np. struktura tabeli z wybranymi rekordami,

określonych wymagań dotyczących zbioru, np.: „co najmniej N wierszy, kolumny C1, C2, C3, gdzie C1 zawiera wartości wzrostu osób rozkładu normalnego w zakresie 1–2 m, C2…”.

W pracy należy wskazać:
Model i data użycia: Copilot 10.2025 r.

Jeżeli dane są udostępniane lub przesyłane do zewnętrznych repozytoriów lub platform (np. Microsoft OneDrive, Dropbox, Google Drive, OpenML itp.), to plik README.txt z opisem źródła i charakterystyki danych musi być dystrybuowany razem z danymi.

Można to zapewnić poprzez umieszczenie danych oraz pliku README.txt w jednym archiwum ZIP albo poprzez umieszczenie wymaganych informacji w dedykowanych polach systemu, jeśli taka funkcjonalność została przewidziana.