Початок роботи

Ласкаво просимо до Syto — браузерного інструменту для очищення та трансформації табличних даних.

Основні поняття

Джерела (Sources)

Джерело — це ваші необроблені дані. Ви можете імпортувати дані:

  • Перетягнувши CSV-файл у вікно програми
  • Вставивши дані з електронної таблиці (Ctrl+V)
  • Імпортувавши з URL-адреси
  • Згенерувавши синтетичні дані

Кожне джерело зберігається у вашому браузері — нічого не надсилається на сервер.

Моделі (Models)

Модель — це трансформована версія джерела. Коли ви додаєте кроки трансформації до джерела, ви створюєте модель. Моделі оновлюються автоматично при додаванні, редагуванні або видаленні кроків.

З одного джерела можна створити кілька моделей, кожна зі своїм пайплайном.

Кроки (Steps)

Крок — це одна трансформація у вашому пайплайні. Кроки застосовуються послідовно, зверху вниз. Кожен крок отримує результат попереднього кроку як вхідні дані.

Приклади кроків: Фільтрація рядків, Обчислення нового стовпця, Сортування, Агрегація, З'єднання з іншим набором даних.

Швидкий робочий процес

  1. Імпорт — Перетягніть CSV-файл у програму або скористайтеся кнопками Завантажити/Вставити/URL
  2. Трансформація — Оберіть трансформацію зі стрічки інструментів (вкладки Підготовка, Обчислення або Об'єднання)
  3. Попередній перегляд — Кожен крок показує миттєвий попередній перегляд його впливу на дані
  4. Ітерація — Додавайте нові кроки, змінюйте порядок або редагуйте існуючі, натиснувши на них
  5. Експорт — Завантажте очищені дані у форматі CSV або JSON

Поради

  • Клікніть на заголовок стовпця — для сортування, фільтрації, перейменування або зміни типу
  • Клікніть на значення комірки — для швидкої фільтрації або заміни
  • Використовуйте панель EDA (перемикайте іконкою графіка) — для перегляду розподілів та статистики
  • Клавіші-стрілки — навігація між кроками, коли діалогове вікно не відкрите
  • Ctrl+S — збереження робочого процесу