امروز چهارشنبه ، ۱۴۰۱/۰۴/۱۵
بدان
FAENZYXWVUTSRQPONMLKJIHGFEDCBA

خوک آپاچی

خوک آپاچی به چه معناست؟ Apache Pig پلتفرمی است که برای تجزیه و تحلیل مجموعه داده های بزرگ استفاده می شود. این شامل یک زبان سطح بالا برای بیان برنامه های تجزیه و تحلیل داده ها، همراه با زیرساخت ارزیابی این برنامه ها است. یکی از مهم ترین ویژگی های Pig این است که ساختار آن به موازی سازی قابل توجه پاسخ می دهد. Pig بر روی پلت فرم Hadoop کار می کند و داده ها را در سیستم فایل توزیع شده Hadoop (HDFS) می نویسد و می خواند و پردازش را با استفاده از یک یا چند کار MapReduce انجام می دهد. آپاچی پیگ به صورت متن باز در دسترس است. Apache Pig با نام های Pig Programming Language یا Hadoop Pig نیز شناخته می شود.Bedan خوک آپاچی را توضیح می دهد آپاچی پیگ دو بخش دارد: زبان لاتین خوک و موتور خوک. زبان لاتین Pig یک زبان برنامه نویسی است که به کاربران اجازه می دهد روشی را که در آن جریان داده از یک یا چند ورودی باید خوانده و پردازش شود و مکانی که باید در آن ذخیره شود را نشان دهند. برخی از خواص کلیدی Pig Latin به شرح زیر است: برنامه نویسی آسان: وظایف پیچیده متشکل از تبدیل داده های مختلف به هم پیوسته به وضوح به عنوان دنباله های جریان داده کدگذاری می شوند. این امر نوشتن، درک و نگهداری آنها را ساده می کند. امکانات بهینه سازی: نحوه کدگذاری وظایف به سیستم اجازه می دهد تا اجرای خودکار را بهینه کند. این به کاربر این امکان را می دهد که به جای کارایی به معناشناسی توجه کند. توسعه پذیری: کاربران مجاز به ایجاد عملکردهای خود برای انجام پردازش با هدف خاص هستند. موتور Pig مسئول اجرای جریان داده نوشته شده به لاتین Pig است. Apache Pig مانند طراحی سیستم مدیریت پایگاه داده رابطه‌ای استاندارد (RDBMS)، علاوه بر اپراتورهایی که پردازش داده‌ها را انجام می‌دهند، از تجزیه‌کننده، بهینه‌ساز و بررسی‌کننده نوع تشکیل شده است. Pig شامل تراکنش‌ها، کاتالوگ داده یا توانایی مدیریت مستقیم ذخیره‌سازی داده یا استفاده از چارچوب اجرا نمی‌شود.

Apache Pig

What Does Apache Pig Mean? Apache Pig is a platform that is used to analyze large data sets. It consists of a high-level language to express data analysis programs, along with the infrastructure to evaluate these programs. One of the most significant features of Pig is that its structure is responsive to significant parallelization. Pig operates on the Hadoop platform, writing data to and reading data from the Hadoop Distributed File System (HDFS) and performing processing by means of one or more MapReduce jobs. Apache Pig is available as open source. Apache Pig is also known as Pig Programming Language or Hadoop Pig. Techopedia Explains Apache Pig Apache Pig has two parts: Pig Latin language and Pig engine. The Pig Latin language is a scripting language that allows users to illustrate the way in which data flow from one or more inputs must be read and processed, and the location in which must be stored. Some of the key properties of Pig Latin are as follows: Easy to program: Intricate tasks consisting of various interconnected data transformations are clearly encoded as data flow sequences. This makes them simple to write, understand and maintain. Optimization possibilities: The manner in which the tasks are encoded allows the system to optimize automatic execution. This allows the user to pay attention to semantics instead of efficiency. Extensibility: Users are allowed to create their own functions for carrying out special-purpose processing. The Pig engine is responsible for the execution of data flow written in Pig Latin. Much like a standard relational database management system (RDBMS) design, Apache Pig consists of a parser, optimizer and type checker, in addition to operators that carry out data processing. Pig does not include transactions, a data catalog or the ability to directly handle data storage or employ the execution framework.