Veri Mühendisi (Veri Analisti (Databricks, Apache Spark ve Delta Lake, GenAI veya AI/ML entegrasyonları).)

Datamatics

Pazarlıklı
Uzak3-5 Yıl DeneyimDiplomaSözleşme
Paylaşmak

Uzaktan Ayrıntılar

Açık ÜlkeFilipinler

Dil Gereksinimleriİngilizce

Bu uzaktan iş belirli ülkelerdeki adaylara açıktır. Olası konum kısıtlamalarına rağmen devam etmek isteyip istemediğinizi lütfen onaylayın

İş tanımı

Orijinal metni göster

Açıklama

İş Rolü: Veri Analisti (Databricks, Apache Spark ve Delta Lake, GenAI veya AI/ML entegrasyonları).

Konum: Manila.

Süre: 6+ Ay Sözleşmesi.


İş Tanımı:

Çalışma Kapsamı/Sorumluluklar

1. Veri Boru Hattı Geliştirme:

  • Databricks ve ilgili teknolojileri kullanarak uçtan uca veri boru hatlarını tasarlayın, uygulayın ve optimize edin.
  • Büyük ölçekli veri alma, dönüşüm ve depolama işlemlerine yönelik iş akışları oluşturun.


2. LLM'ler için Veri Hazırlığı:

  • LLM eğitim ve ince ayarları için çeşitli veri setlerini (metin, yapılandırılmış ve yapılandırılmamış) ön işleme, temizleme ve yapılandırma.
  • NLP modellerini desteklemek için uygulama mühendisliği, tokenizasyon ve vektörleştirme tekniklerini uygulayın.


3. Performans Optimizasyonu:

  • Veri iş akışlarını basitleştirmek için Databricks özelliklerini, Delta Lake ve MLflow dahil, kullanın.
  • Yüksek kullanılabilirlik, ölçeklenebilirlik ve maliyet verimliliği için veri altyapısını optimize edin.


4. Takımlarla İşbirliği:

  • LLM teknoloji gereksinimlerindeki veri gereksinimlerini anlamak için veri bilimcileri, ML mühendisleri ve diğer paydaşlarla birlikte çalışın.
  • Mühendislik boru hatları ile makine öğrenimi hedefleri arasındaki uyumu sağlayın.


5. Veri Kalitesi & Yönetim:

  • Veri kalitesini, tutarlılığı ve yönetim politikalarına uyumu sağlamak için süreçler uygulayın.
  • Boru hattı yaşam döngüsü boyunca veri bütünlüğünü izleyin ve koruyun.


6. Yeni Teknoloji Benimseme:

  • Databricks, yaratıcı AI ve LLM teknolojilerindeki gelişmelerden haberdar olun.
  • İş akışlarını geliştirmek için yenilikçi araçların ve uygulamaların benimsenmesine katkıda bulunun.



Gereksinimler ve Nitelikler (Eğitim & İş Deneyimi)


Deneyim:

  • Veri mühendisliği rollerinde 7+ yıl deneyim, en az 2 yıl liderlik rolünde ve Databricks projelerinde deneyim.
  • Veri boru hatları, uygulama mühendisliği ve makine öğrenimi için veri seti hazırlığı konularında kanıtlanmış uzmanlık, özellikle LLM'ler.
  • GenAI veya AI/ML entegrasyonları ile kurumsal sınıf uygulamalar oluşturma deneyimi.


Teknik Beceriler:


  • Databricks, Apache Spark ve Delta Lake konularında uzmanlık.
  • Python ve SQL'de güçlü programlama becerileri; pandas, NumPy veya PyTorch gibi kütüphaneler hakkında bilgi artı olarak değerlidir.
  • Durum yönetimi kütüphaneleri hakkında anlayış; Redux, Recoil veya Zustand.Cypress), ve sürüm kontrolü (Git).
  • Kurumsal uygulamalar için web güvenliği ilkeleri ve uyum gereksinimleri konusunda anlayış.


Yumuşak Beceriler:

  • Olağanüstü sorun çözme ve karar verme yetenekleri.
  • Mükemmel iletişim ve liderlik becerileri, teknik tartışmaları yönlendirme ve takım üyelerini mentorluk yapabilme yeteneği.
  • Yüksek kaliteli sonuçlar sunmaya güçlü odak.

Gereklilik

Lütfen iş tanımına başvurun.

Veri ModellemeETL SüreçleriSQLPythonVeri AmbarıBüyük Veri TeknolojileriBulut BilişimVeri Boru Hattı OtomasyonuNoSQLVeri Kalitesi Güvencesi
Preview

Boss

HR ManagerDatamatics

Yayınlandı 23 April 2025

Datamatics

>1000 Çalışan

Diğerleri

İşe alınan iş ilanını görüntüle

Rapor

Bossjob Güvenlik Hatırlatması

Eğer pozisyon yurt dışında çalışmanızı gerektiriyorsa lütfen dikkatli olun ve dolandırıcılığa karşı dikkatli olun.

İş arayışınız sırasında aşağıdaki davranışlara sahip bir işverenle karşılaşırsanız, lütfen hemen bildirin

  • kimliğinizi saklıyor,
  • bir garanti vermenizi veya mülkünüzü tahsil etmenizi gerektiriyorsa,
  • sizi yatırım yapmaya veya fon toplamaya zorluyorsa,
  • Yasadışı menfaatler topluyor,
  • veya diğer yasa dışı durumlar.