Teknoloji

Yapay Zekâ Firmaları İnternetten Veri Toplamaya Devam Ediyor

Yapay zekâ firmalarının, robots.txt olarak da bilinen yönergeleri atladığı ortaya çıktı.

Yapay Zekâ Firmaları İnternetten Veri Toplamaya Devam Ediyor
22-06-2024 22:07

Yapay ÖZETİ| zekânın yükselişi ile birlikte bu alana giren firmalar, kendi araçlarını geliştirmek için çok büyük miktarda verilere ihtiyaç duyuyorlar. Bu verileri bulmak için akla gelen ilk alternatif ise elbette ki internet oluyor. Öte yandan internetteki her veri, her yazı yapay zekâ eğitmekte kullanılamıyor. İnternet siteleri, kendilerinden verilerin alınıp alınamayacağını robots.txt adlı bir dosya ile belirtiyor. 

Reuters'ın haberine göre çok sayıda yapay zekâ geliştiricisi bu dosyada yer alan yönlendirmeleri aşmayı tercih ediyor ve bu sitelerden de veriler topluyorlar. Özellikle kendisini "ücretsiz yapay zekâ arama motoru" olarak tanıtan Perplexity bu konuda tepkileri en çok üzerine çeken firmalardan biri olsa da bu uygulamada yalnız değil. 

OpenAI, Anthropic…

yapay zeka

Gelen raporlara göre pek çok yapay zekâ geliştiricisi robots.txt dosyalarını pas geçerek sitelerden içerik almaya devam ediyor. Raporda isim verilmese de bu firmalar arasında OpenAI ve Anthropic'in de yer aldığı öğrenildi. Perplexity tarafından kullanılan bir sunucunun da bu yönergeleri takip etmediği ortaya çıktı. Perplexity CEO'su Aravind Srinivas daha önce yaptığı açıklamada ise firmanın "önce protokolü pas geçip sonradan da bu konuda yalan söyleme durumunun olmadığını" söylemişti. 

Öte yandan robots.txt protokolü 1990'lı yıllardan beri kullanılıyor ve aslında yasal bir bağlayıcılığı yok. Belki de bu konuda daha sıkı ve daha detaylı yeni bir protokol oluşturmak sorunun çözümüne katkıda bulunacaktır. 


Editor : Şerif SENCER
SİZİN DÜŞÜNCELERİNİZ?
IIS 10.0 Detailed Error - 403.501 - Forbidden

HTTP Error 403.501 - Forbidden

You do not have permission to view this directory or page.

Most likely causes:

  • This is a generic 403 error and means the authenticated user is not authorized to view the page.

Things you can try:

  • Create a tracing rule to track failed requests for this HTTP status code. For more information about creating a tracing rule for failed requests, click here.

Detailed Error Information:

Module   IIS Web Core
Notification   Unknown
Handler   ASPClassic
Error Code   0x00000000
Requested URL   https://api.haberpanelim.com:443/haberler_mobil.asp?domain=https://www.idrak34.com&t=1735266603
Physical Path   C:\Inetpub\vhosts\api.haberpanelim.com\httpdocs\haberler_mobil.asp
Logon Method   Not yet determined
Logon User   Not yet determined

More Information:

This generic 403 error means that the authenticated user is not authorized to use the requested resource. A substatus code in the IIS log files should indicate the reason for the 403 error. If a substatus code does not exist, use the steps above to gather more information about the source of the error.

View more information »

Kepez’de final maç heyecanı
www.duyantalya.com.tr
BUNLAR DA İLGİNİZİ ÇEKEBİLİR
ÇOK OKUNAN HABERLER