Dane syntetyczne
Jeżeli badanie naukowe, publikacja, rozprawa lub praca dyplomowa wykorzystuje lub bazuje na danych syntetycznych, to kluczowe jest, by w treści dokumentu wprost zaznaczyć, że użyte dane mają charakter syntetyczny.
Do takich danych powinny być dołączone odpowiednie metadane, które jasno potwierdzają ich syntetyczne pochodzenie oraz opisują proces ich generowania.
Przykład:
Jeżeli dane zapisane są w arkuszu kalkulacyjnym (np. w formacie CSV lub Excel), do pliku z danymi należy dołączyć plik README.txt zawierający informację:
Niniejszy zbiór danych został automatycznie wygenerowany z użyciem generatywnej sztucznej inteligencji, przy wykorzystaniu:
- promptu, np.: „Wygeneruj dane o następujących cechach…”,
- przykładowych wartości, np. struktura tabeli z wybranymi rekordami,
- określonych wymagań dotyczących zbioru, np.: „co najmniej N wierszy, kolumny C1, C2, C3, gdzie C1 zawiera wartości wzrostu osób rozkładu normalnego w zakresie 1–2 m, C2…”.
W pracy należy wskazać:
Model i data użycia: Copilot 10.2025 r.
Jeżeli dane są udostępniane lub przesyłane do zewnętrznych repozytoriów lub platform (np. Microsoft OneDrive, Dropbox, Google Drive, OpenML itp.), to plik README.txt z opisem źródła i charakterystyki danych musi być dystrybuowany razem z danymi.
Można to zapewnić poprzez umieszczenie danych oraz pliku README.txt w jednym archiwum ZIP albo poprzez umieszczenie wymaganych informacji w dedykowanych polach systemu, jeśli taka funkcjonalność została przewidziana.